2024-08-01 12:00:01
Anthropic знищив мільйони книг заради навчання Claude

Днями суд у США ухвалив рішення, що Anthropic мав право навчати Claude на легально куплених книгах без окремого дозволу їх авторів. Але в рамках судового процесу з'ясувалися подробиці, як саме відбувався цей процес.

Для збору даних Anthropic найняв Тома Терві — колишнього керівника Google Books. Його завдання було амбітним: отримати «всі книги у світі». Компанія придбала кілька мільйонів нових і старих книг, а потім почався процес «деструктивного сканування». У книг зрізали палітурки, сторінки пропускали через сканер для швидкого оцифрування, а паперові оригінали викидали.

При цьому OpenAI і Microsoft, наприклад, для своїх цілей співпрацюють з бібліотеками і намагаються зберігати видання, що скануються.
Читати в Telegram