Uno de los problemas actuales del aprendizaje profundo es que necesita un conjunto de datos de entrenamiento muy grande. Por eso, Makoto pasó tres meses sacando fotos a 7.000 pepinos, pero no son suficientes.
“Cuando hice una validación con las imágenes de entrenamiento, la precisión al reconocer los pepinos era de más del 95%, pero, con pepinos reales, se reduce al 70%. Sospecho que el modelo de red neuronal tiene el problema de “sobreajustarse” (lo que pasa cuando el modelo está entrenado para encajar solamente con el conjunto de datos de entrenamiento) al no haber suficientes imágenes de ejemplo”.
El segundo problema del aprendizaje profundo es que consume muchos recursos informáticos. La clasificadora actual utiliza un PC corriente con Windows para el modelo de red neuronal, y, aunque reduce la resolución de las fotos de los pepinos, tarda tres días en completar un modelo de 7.000 imágenes.
“El sistema solo puede clasificar los pepinos según su forma, longitud y nivel de distorsión. No reconoce el color, la textura ni las imperfecciones, que mejorarían su precisión, pero también prolongarían el entrenamiento”.
Para mejorar el aprendizaje profundo, algunas empresas han comenzado a entrenarlo a gran escala, pero sus servidores son muy caros. Google ofrece Cloud Machine Learning (Cloud ML) para que los desarrolladores puedan probar el aprendizaje profundo sin tener que invertir mucho dinero.