Parmi les nombreuses contraintes de l'entraînement en IA, le goulot d'étranglement des données est souvent plus sévère que celui du calcul, mais il est rarement pris en compte. Contrairement à une simple accumulation de puissance de calcul, une véritable percée nécessite d'agir simultanément sur deux dimensions. En utilisant un mécanisme de crowdsourcing pour obtenir des données d'entraînement de haute qualité, combiné à une architecture de traitement distribuée, il est possible de briser complètement cette barrière. Beaucoup de projets privilégient soit le calcul au détriment des données, soi
Voir l'original