OpenAI преговаря с издатели на новини

Компанията предлага до $5 млн. годишно за лицензионно съдържание

05 януари 2024, 16:13 a+ a- a

Снимка: iStock

Докато компании за изкуствен интелект (ИИ/AI) сключват сделки с издателите на новини, за да обучават своите модели с новинарски истории, цената, която бизнеси като OpenAI са готови да платят за защитена с авторски права информация, излиза наяве, пише The Verge.

Свързани новини

Google проучва използването на изкуствен интелект в създаването на новини

OpenAI ще подкрепя местните новини в САЩ

The Information съобщава, че OpenAI предлага между $1 и $5 млн. годишно за лицензиране на защитени с авторски права новинарски статии за обучение на своите AI модели. Това е една от първите индикации колко ИИ компанииte планират да платят за лицензирани материали. Тя е в съответствие с неотдавнашно съобщение, според който Apple търси партньорство с медийни компании, за да използва съдържание за обучение на AI и предлага най-малко $50 млн. за многогодишен период за данни. The Verge се обърна към OpenAI за коментар относно числата.

Числата изглеждат приблизително подобни на някои по-ранни лицензионни сделки без AI. Когато Meta стартира раздела за новини във Facebook (преустановен в Европа) се твърди, че предлага до $3 млн. годишно за лицензиране на новини, заглавия и визуализации. Но не е ясно дали общите изплащания ще се равняват на някои от по-големите числа, които сме виждали.

Google обяви през 2020 г., че ще инвестира общо $1 млрд., за да си партнира например с новинарски организации. Под натиска на нов закон, Google също наскоро се съгласи да плаща на канадските издатели общо $100 млн. годишно в замяна на връзки към техните статии.

Днешните големи езикови модели, доколкото знаем какво има в техните данни за обучение, са били обучени главно на информация от интернет. Докато някои AI модели не разкриват как са получили своите данни за обучение, често е налична информация за това кои набори от данни или уеб роботи са използвани. Ценообразуването за набори от данни за обучение варира в зависимост от доставчика, размера и съдържанието на набор от данни. Някои доставчици на данни, като LAION, са с отворен код и са напълно безплатни и се използват от модели като Stable Diffusion. Разработчиците на изкуствен интелект също често настройват уеб роботи, които събират данни в интернет, за да обучат своите модели. (Разработчиците на ИИ все още трябва да наемат хора за проверка, маркиране и понякога почистване на данни за обучение, което значително увеличава оперативните разходи.)

Но тази практика сега е изправена пред големи предизвикателства. От една страна, GPT роботът на OpenAI е блокиран от достъп до данни от някои компании, включително The New York Times и компанията майка на The Verge, Vox Media. От друга страна, няколко организации твърдят, че обучението по техните данни представлява нарушение на авторските права. New York Times, наред с други, съди OpenAI и Microsoft за нарушаване на авторски права, твърдейки, че ChatGPT и Copilot на Microsoft могат да генерират отговори почти дословно идентични с тяхната работа.

Партньорствата позволяват на компаниите за AI да избегнат тези проблеми и това стана по-честа практика през последната година. Издатели като Axel Springer (компанията майка на Politico и Business Insider) и The Associated Press са подписали споразумения с OpenAI за лицензиране на истории за обучение на модели като GPT-4 и разработване на технология за събиране на новини.

OpenAI и Apple не са единствените разработчици на AI, които се надяват да работят с новинарски организации. Съобщава се, че Google демонстрира AI инструмент, наречен Genesis, който взема факти и изплюва новинарски истории на ръководители от The New York Times, The Wall Street Journal и The Washington Post. В същото време някои новинарски организации са използвали генеративни AI инструменти в редакциите със смесени резултати.

26 април 2024, 14:45

България

ОИСР: 15-годишните у нас с по-ниски очаквания за завършване на висше от връстниците си по света

Социално-емоционалните умения са решаващи за академичния успех, професионалната реализация и качеството на живот на младежите, сочи проучване на ОИСР

26 април 2024, 14:34

България

Метрото ще се разшири с 2 станции в "Люлин"

Прогнозната цена е 147 млн. лева, ще се търси финансиране и от ЕС

26 април 2024, 14:14

България

За първи път: Пускат 7 двуетажни влака у нас

Полска фирма ще достави на България влаковете за над 300 милиона лева

26 април 2024, 13:50

България

Българските иновативни училища влизат в мрежата на ОИСР

Създателят на изследването PISA е у нас, за да представи резултатите от социално-емоционалните умения на учениците по света

26 април 2024, 11:47

Бизнес

Делойт Централна Европа откри нов хъб в София

Екипът в София в момента се състои от 50 професионалисти, амбицията е да се увеличи до 500 през следващите няколко години

25 април 2024, 17:15

България

Future Jobs: Какво и как ще работим в бъдеще?

Какви нови професии ще се появяват в бъдеще и ще се променят ли моделите на работа, дискутират Футурологът д-р Мариана Тодорова и Председателят на УС на БАСКОМ Доброслав Димитров

25 април 2024, 11:36

Бизнес

SAP Labs България: Открихме над 200 работни места от 2023, продължаваме да растем

С програмата SAP Next Talent даваме шанс на завършващи студенти с ИТ профил да продължат кариерата си в компанията - Радослав Николов, изпълнителен директор, пред Economy.bg