Модели лицензий 'Open' часто несут обеспокоенные ограничения

На этой неделе Google выпустил семейство открытых искусственного интеллекта моделей, Gemma 3, которые быстро получили похвалу за их впечатляющую эффективность. Но как отметило несколько разработчиков на Х, лицензия Gemma 3 делает коммерческое использование моделей рискованным предприятием.

Это не проблема, уникальная для Gemma 3. Компании, такие как Meta, также применяют специальные, нестандартные лицензионные условия к своим открытым моделям, и эти условия представляют юридические проблемы для компаний. Некоторые фирмы, особенно более мелкие операции, беспокоятся о том, что Google и другие могут 'выкрутить ковер' из-под них, предъявив более обременительные статьи.

“Ограничительность и несоответствие лицензирования так называемых 'открытых' моделей искусственного интеллекта создают значительную неопределенность, особенно для коммерческого применения,” - сказал Ник Видаль, руководитель сообщества в Open Source Initiative, долго действовавшем институте, цель которого - определить и 'стержневать' все открытые источники, - ​​рассказал журналу TechCrunch. 'Хотя эти модели маркетингуются как открытые, фактические условия налагают различные юридические и практические препятствия, отталкивающие бизнес от интеграции их в свои продукты и услуги.'”

Разработчики открытых моделей имеют свои причины для выпуска моделей под собственными лицензиями, в отличие от отраслевых стандартных вариантов, таких как Apache и MIT. Например, стартап по искусственному интеллекту Cohere четко декларирует свое намерение поддерживать научную работу, но не коммерческую, на основе своих моделей.

Но в частности лицензии Llama и Meta’s Llama имеют ограничения, ограничивающие способы использования моделей без опасения юридических репрессий.

Например, Meta запрещает разработчикам использовать 'вывод или результаты' моделей Llama 3 для улучшения любой модели, кроме Llama 3 или 'производных работ'. Также она не позволяет компаниям с более чем 700 миллионами ежемесячных активных пользователей развертывать модели Llama без предварительного получения специальной, дополнительной лицензии.

Лицензия Gemma обычно менее обременительна. Но она дает Google право 'ограничивать (удаленно или иначе) использование' Gemma, которое Google считает нарушающим запретное использование компании или 'применимые законы и нормативные акты'.

Эти условия не относятся только к исходным моделям Llama и Gemma. Модели, основанные на Llama или Gemma, также должны соблюдать лицензии Llama и Gemma, соответственно. В случае Gemma, это включает модели, обученные на синтетических данных, сгенерированных Gemma.

Флориан Бранд, научный сотрудник в Немецком центре исследований искусственного интеллекта, считает, что - независимо от того, что говорят руководители технологических гигантов - лицензии, такие как Gemma и Llama, не могут разумно называться 'открытыми источниками'.

“Большинство компаний имеют набор утвержденных лицензий, таких как Apache 2.0, поэтому любая специальная ​​лицензия это много хлопот и денег,” - сказал Бранд TechCrunch. 'Маленькие компании без юридических команд или денег на адвокатов будут придерживаться моделей с стандартными лицензиями.'”

Бранд отметил, что разработчики искусственно-интеллектуальных моделей с нестандартными лицензиями, такие ​​как Google, пока не активно применяют свои условия. Однако, угроза зачастую достаточна для отпугивания принятия, добавил он.

“Эти ограничения влияют на экосистему искусственного интеллекта - даже на исследователей по искусственному интеллекту, как я,” - сказал Бранд.

Хан-Чунг Ли, руководитель машинного обучения в Moody’s, согласен, что кастомные лицензии, такие ​​как те, которые прикреплены к Gemma и Llama, делают модели 'непригодными' во многих коммерческих сценариях. Также согласен Эрик Трамель, сотрудник прикладного ученого в стартапе по искусственному интеллекту Gretel.

“Модельно-специфические лицензии делают особые оговорки для производных и концентрования моделей, что вызывает беспокойство о возврате прав,” - сказал Трамель. 'Представьте себе бизнес, специально производящий тонкие настройки модели для своих клиентов. Какая лицензия должна быть у тонкой настройки данных Gemma? Каков будет эффект на всех его последующих клиентов?'”

Сценарий, который больше всего боятся развертывающие, сказал Трамель, это что модели являются своего рода троянским конём.

“Модель находилка может выпускать [открытые] модели, ждать развития деловых случаев с использование этих моделей, а затем сверхлегкое заседательство в успешные вертикали путем либо вымогательства, либо судебных выяснений,”- сказал он. 'Например, Gemma 3, по всей видимости, кажется надежным релизом - и одним, который мог бы оказать широкое влияние. Но рынок не может его принять из-за его структуры ​​лицензии. Поэтому бизнесы, вероятнее всего, придерживаются, возможно, более слабых и менее надежных моделей Apache 2.0.'”

Чтобы быть ясным, некоторые модели достигли широкого распространения, несмотря на их ограничительные лицензии. Например, Llama была загружена сотни миллионов раз и встроена в продукты крупных корпораций, включая Spotify.

Но они могли бы быть еще более успешными, если бы они были разрешительно лицензированы, по словам Ясин Жернит, руководителя машинного обучения и общества в стартапе по искусственному интеллекту Hugging Face. Жерните призвал поставщиков, такие ​​как Google, перейти к открытым лицензионным рамкам и 'более прямому сотрудничеству' с пользователями по широко принятым условиям.

“Учитывая отсутствие консенсуса по этим условиям и тот факт, что многие из базовых предположений еще не были проверены в судах, все это служит прежде всего как декларация намерения от этих акторов,” - сказал Жернит. '[Но если определенные пункты] будут толковаться слишком широко, много хорошей работы окажется на неопределенной юридической почве, что особенно страшно для организаций, создающих успешные коммерческие продукты.'”

Видаль сказал, что существует настоятельная необходимость в компаниях моделей искусственного интеллекта, которые могут свободно интегрироваться, модифицироваться и делиться, не опасаясь внезапных изменений лицензии или юридической неопределенности.

“Нынешняя ситуация с лицензированием моделей искусственного интеллекта наполнена путаницей, ограничительными условиями и ошибочными утверждениями относительно открытости,” - сказал Видаль. 'Вместо того чтобы переопределять 'открытость' во благо корпоративных интересов, индустрия искусственного интеллекта должна выравниваться с установленными принципами открытого источника, чтобы создать действительно открытую экосистему.'”