Harvard veröffentlicht massiven Public-Domain-Buchdatensatz für KI-Training, finanziert von Tech-Giganten.
Die Harvard University hat mit Unterstützung von Microsoft und OpenAI einen Datensatz von fast einer Million Public-Domain-Büchern für die Ausbildung von KI-Modellen veröffentlicht. Die Institutionelle Dateninitiative zielt darauf ab, kleineren Entwicklern den Zugang zu qualitativ hochwertigen Daten zu ermöglichen, die typischerweise nur für Tech-Giganten verfügbar sind und damit die Wettbewerbsbedingungen bei der KI-Entwicklung ebnen. Der Datensatz enthält Bücher aus dem Google Books-Projekt und kann von jedem genutzt werden, um KI zu trainieren, von Hobbyisten bis hin zu Unternehmen.
Vor 3 Monaten
9 Artikel