Creative Commons запускає CC Signals для роботи з AI
Creative Commons — організація, що виступає за відкрите використання авторських робіт, з умовою збереження авторства. Це може стосуватись текстів, відео, фото. Наприкінці червня команда CC оголосила, що запускає новий напрямок роботи — CC Signals, його мета — робота з даними в еру штучного інтелекту.
- CC Signals — проєкт ліцензування, який дозволить власникам датасетів деталізувати, як їхній контент може або не може бути повторно використаний машинами: наприклад, для навчання моделей штучного інтелекту.
- Ідея полягає в тому, щоб створити баланс між відкритою природою інтернету та зростанням попиту на дані для підживлення ШІ.
Ідея створення нового напрямку полягає у тому, як взаємодія AI-компаній і власників інформаційного ресурсу відбувається зараз: часто дані беруть без дозволу, а слідом йде судова тяганина.
Один шлях веде до масового вилучення даних і розмивання відкритості; інший — до інтернету за стінами платного доступу.
Наприклад:
- X спочатку дозволив стороннім особам навчати моделі на своїх відкритих даних, але пізніше скасував це.
- Reddit використовує файл robots.txt, призначений для інформування автоматизованих вебсканерів, чи можуть вони отримувати доступ до сайту, щоб заборонити ботам збирати дані для навчання AI.
- Cloudflare розглядає рішення, яке передбачає стягування плати з ботів AI за скрапінг, а також інструменти для їх заплутування.
- Розробники з відкритим кодом створили інструменти, що сповільнюють або марнують ресурси ботів AI, які не дотримуються вказівок «не сканувати».
Проєкт CC Signals має на меті запропонувати юридичне та технічне рішення, яке створить рамки для обміну датасетами між тими, хто контролює дані, і тими, хто використовує їх для навчання AI.
Представники організації вказують, що попит на такий інструмент зростає, оскільки компанії намагаються змінити свої політики та умови використання, щоб або обмежити навчання AI на своїх даних, або пояснити, в якій мірі вони самі використовуватимуть дані користувачів для цілей, пов’язаних зі штучним інтелектом.
Проєкт CC Signals натомість пропонує інше рішення: набір інструментів, що мають різний рівень юридичної обов’язковості та етичну вагу, подібно до ліцензій Creative Commons, які сьогодні охоплюють мільярди відкрито ліцензованих творчих робіт в інтернеті.
Конкретного рішення поки немає, команда працює зі створенням такої ліцензії та готова до збору зворотного звʼязку, який можна залишити на сайті.
Creative Commons запускає CC Signals для роботи з AI
Creative Commons — організація, що виступає за відкрите використання авторських робіт, з умовою збереження авторства. Це може стосуватись текстів, відео, фото. Наприкінці червня команда CC оголосила, що запускає новий напрямок роботи — CC Signals, його мета — робота з даними в еру штучного інтелекту.
- CC Signals — проєкт ліцензування, який дозволить власникам датасетів деталізувати, як їхній контент може або не може бути повторно використаний машинами: наприклад, для навчання моделей штучного інтелекту.
- Ідея полягає в тому, щоб створити баланс між відкритою природою інтернету та зростанням попиту на дані для підживлення ШІ.
Ідея створення нового напрямку полягає у тому, як взаємодія AI-компаній і власників інформаційного ресурсу відбувається зараз: часто дані беруть без дозволу, а слідом йде судова тяганина.
Один шлях веде до масового вилучення даних і розмивання відкритості; інший — до інтернету за стінами платного доступу.
Наприклад:
- X спочатку дозволив стороннім особам навчати моделі на своїх відкритих даних, але пізніше скасував це.
- Reddit використовує файл robots.txt, призначений для інформування автоматизованих вебсканерів, чи можуть вони отримувати доступ до сайту, щоб заборонити ботам збирати дані для навчання AI.
- Cloudflare розглядає рішення, яке передбачає стягування плати з ботів AI за скрапінг, а також інструменти для їх заплутування.
- Розробники з відкритим кодом створили інструменти, що сповільнюють або марнують ресурси ботів AI, які не дотримуються вказівок «не сканувати».
Проєкт CC Signals має на меті запропонувати юридичне та технічне рішення, яке створить рамки для обміну датасетами між тими, хто контролює дані, і тими, хто використовує їх для навчання AI.
Представники організації вказують, що попит на такий інструмент зростає, оскільки компанії намагаються змінити свої політики та умови використання, щоб або обмежити навчання AI на своїх даних, або пояснити, в якій мірі вони самі використовуватимуть дані користувачів для цілей, пов’язаних зі штучним інтелектом.
Проєкт CC Signals натомість пропонує інше рішення: набір інструментів, що мають різний рівень юридичної обов’язковості та етичну вагу, подібно до ліцензій Creative Commons, які сьогодні охоплюють мільярди відкрито ліцензованих творчих робіт в інтернеті.
Конкретного рішення поки немає, команда працює зі створенням такої ліцензії та готова до збору зворотного звʼязку, який можна залишити на сайті.