сряда, 04 декември 2024   RSS
    Барометър | Региони | Компании | Лица | Назначения


    717 прочитания

    Създадоха голям езиков модел с арабски

    Jais, съдържа 13 милиарда параметъра и е с отворен код
    31 август 2023, 16:11 a+ a- a

    Снимка: iStock

    Група инженери, изследователи и базирана в Силиконовата долина компания за чипове си сътрудничиха, за да създадат усъвършенстван софтуер на арабски език, който може да захранва генеративни AI приложения, съобщи „Ройтерс“.

    Новият голям езиков модел, наречен Jais, съдържа 13 милиарда параметъра, които са направени от голяма партида данни, комбиниращи арабски и английски, част от които е и компютърен код.

    Групата, която включва учени и инженери, се зае с проекта отчасти защото казаха, че има малко големи езикови модели, които са двуезични.

    Новият езиков модел е създаден с помощта на суперкомпютри, произведени от базираната в Силиконовата долина Cerebras Systems, която проектира чипове с размер на чиния, които се конкурират с мощния AI хардуер на Nvidia. Чиповете на Nvidia са дефицитni, което накара компаниите по света да търсят алтернативи.

    Кръстен на най-високия връх в Обединените арабски емирства, Jais е сътрудничество между Cerebras, Университета за изкуствен интелект „Мохамед бин Зайед“ и дъщерно дружество на базирания в Абу Даби технологичен конгломерат G42, наречен Inception, който се фокусира върху изкуствен интелект (AI).

    Според професор Тимъти Болдуин от Университета за AI интелект „Мохамед бин Зайед“, тъй като няма достатъчно данни на арабски, за да се обучи модел с размера на Jais, компютърният код в данните на английски език помага да се обучи способността на модела да разсъждава,.

    „(Кодът) дава на модела голямо предимство по отношение на способностите за разсъждение, защото изписва (логичните) стъпки“, каза Болдуин пред „Ройтерс“.

    Jais ще бъде достъпен чрез лиценз с отворен код.

    Групата обучава модела Jais на суперкомпютър Cerebras, наречен Condor Galaxy, изграден в партньорство с G42. Тази година Cerebras обяви, че се е съгласила да построи 3 такива единици с G42, като първата е планирана да пристигне тази година, а две допълнителни единици ще бъдат доставени през 2024 г.

    „Този модел беше обучен от началото до края на 13 милиарда (параметри) за 3 дни и половина“, каза изпълнителният директор на Cerebras Андрю Фелдман. „Но имаше месеци работа преди това.“

    Нагоре
    Отпечатай
     
    * Въведеният имейл се използва само за целите на абонамента, имате възможност да прекратите абонамента по всяко време.

    преди 17 часа
    Стойността на глобалният пазар на Cloud ERP ще достигне $57,17 млрд. през 2024
    Сегментът на малките и средни предприятия се очаква да регистрира най-високият средногодишен темп на растеж, според Fortune Business Insights
    преди 18 часа
    Най-големият ритейл парк в Пловдив отвори врати
    Първите магазини в новия търговски комплекс „Парк Макс Ритейл Парк“ вече са отворени
    преди 18 часа
    Черният петък мина онлайн
    Потребителите в САЩ са похарчили $10,8 млрд. за онлайн покупки, което е над 10% ръст спрямо миналата година
    преди 20 часа
    3,7 млрд. лв. е дупката в бюджета в края на ноември
    Приходите за месеца превишават разходите с близо 300 млн. лв.
    преди 21 часа
    САЩ с нов кръг ограничения, свързани с производството на чипове в Китай
    Това е третият кръг мерки в рамките на 3 години
    преди 2 дни
    Канада обвини Google в създаване на рекламен монопол
    Делото прилича на заведеното в САЩ и цели разделяне на бизнесите на технологичния гигант