четвъртък, 22 февруари 2024   RSS
    Барометър | Региони | Компании | Лица | Назначения


    524 прочитания

    Създадоха голям езиков модел с арабски

    Jais, съдържа 13 милиарда параметъра и е с отворен код
    31 август 2023, 16:11 a+ a- a

    Снимка: iStock

    Група инженери, изследователи и базирана в Силиконовата долина компания за чипове си сътрудничиха, за да създадат усъвършенстван софтуер на арабски език, който може да захранва генеративни AI приложения, съобщи „Ройтерс“.

    Новият голям езиков модел, наречен Jais, съдържа 13 милиарда параметъра, които са направени от голяма партида данни, комбиниращи арабски и английски, част от които е и компютърен код.

    Групата, която включва учени и инженери, се зае с проекта отчасти защото казаха, че има малко големи езикови модели, които са двуезични.

    Новият езиков модел е създаден с помощта на суперкомпютри, произведени от базираната в Силиконовата долина Cerebras Systems, която проектира чипове с размер на чиния, които се конкурират с мощния AI хардуер на Nvidia. Чиповете на Nvidia са дефицитni, което накара компаниите по света да търсят алтернативи.

    Кръстен на най-високия връх в Обединените арабски емирства, Jais е сътрудничество между Cerebras, Университета за изкуствен интелект „Мохамед бин Зайед“ и дъщерно дружество на базирания в Абу Даби технологичен конгломерат G42, наречен Inception, който се фокусира върху изкуствен интелект (AI).

    Според професор Тимъти Болдуин от Университета за AI интелект „Мохамед бин Зайед“, тъй като няма достатъчно данни на арабски, за да се обучи модел с размера на Jais, компютърният код в данните на английски език помага да се обучи способността на модела да разсъждава,.

    „(Кодът) дава на модела голямо предимство по отношение на способностите за разсъждение, защото изписва (логичните) стъпки“, каза Болдуин пред „Ройтерс“.

    Jais ще бъде достъпен чрез лиценз с отворен код.

    Групата обучава модела Jais на суперкомпютър Cerebras, наречен Condor Galaxy, изграден в партньорство с G42. Тази година Cerebras обяви, че се е съгласила да построи 3 такива единици с G42, като първата е планирана да пристигне тази година, а две допълнителни единици ще бъдат доставени през 2024 г.

    „Този модел беше обучен от началото до края на 13 милиарда (параметри) за 3 дни и половина“, каза изпълнителният директор на Cerebras Андрю Фелдман. „Но имаше месеци работа преди това.“

    Нагоре
    Отпечатай
     
    * Въведеният имейл се използва само за целите на абонамента, имате възможност да прекратите абонамента по всяко време.

    преди 24 минути
    Nvidia отчете рекордни приходи
    Акциите на компанията отбелязват 200% ръст спрямо година по-рано
    преди 2 часа
    ЕК разследва TikTok за алгоритми, водещи до пристрастяване
    Китайската социална мрежа има над 1 млрд. потребители
    преди 5 часа
    Sameday България планира да инвестира над 17 млн. лева през 2024 г.
    През 2023 г., Sameday отчита 2,6 млн. доставени пратки, с 38% от тях получени чрез автоматизирани шкафчета за доставка извън дома
    преди 6 часа
    Capital One придобива Discover
    Сделката на стойност $35,3 млрд. ще обедини двете най-големи компании за кредитни карти в САЩ
    преди 7 часа
    БНБ: Чуждите инвестиции у нас с ръст от 28% за година
    Най-големите вложения в страната за януари - декември 2023 са от Швейцария, Австрия и Белгия
    преди 8 часа