неделя, 21 април 2024   RSS
    Барометър | Региони | Компании | Лица | Назначения


    566 прочитания

    Създадоха голям езиков модел с арабски

    Jais, съдържа 13 милиарда параметъра и е с отворен код
    31 август 2023, 16:11 a+ a- a

    Снимка: iStock

    Група инженери, изследователи и базирана в Силиконовата долина компания за чипове си сътрудничиха, за да създадат усъвършенстван софтуер на арабски език, който може да захранва генеративни AI приложения, съобщи „Ройтерс“.

    Новият голям езиков модел, наречен Jais, съдържа 13 милиарда параметъра, които са направени от голяма партида данни, комбиниращи арабски и английски, част от които е и компютърен код.

    Групата, която включва учени и инженери, се зае с проекта отчасти защото казаха, че има малко големи езикови модели, които са двуезични.

    Новият езиков модел е създаден с помощта на суперкомпютри, произведени от базираната в Силиконовата долина Cerebras Systems, която проектира чипове с размер на чиния, които се конкурират с мощния AI хардуер на Nvidia. Чиповете на Nvidia са дефицитni, което накара компаниите по света да търсят алтернативи.

    Кръстен на най-високия връх в Обединените арабски емирства, Jais е сътрудничество между Cerebras, Университета за изкуствен интелект „Мохамед бин Зайед“ и дъщерно дружество на базирания в Абу Даби технологичен конгломерат G42, наречен Inception, който се фокусира върху изкуствен интелект (AI).

    Според професор Тимъти Болдуин от Университета за AI интелект „Мохамед бин Зайед“, тъй като няма достатъчно данни на арабски, за да се обучи модел с размера на Jais, компютърният код в данните на английски език помага да се обучи способността на модела да разсъждава,.

    „(Кодът) дава на модела голямо предимство по отношение на способностите за разсъждение, защото изписва (логичните) стъпки“, каза Болдуин пред „Ройтерс“.

    Jais ще бъде достъпен чрез лиценз с отворен код.

    Групата обучава модела Jais на суперкомпютър Cerebras, наречен Condor Galaxy, изграден в партньорство с G42. Тази година Cerebras обяви, че се е съгласила да построи 3 такива единици с G42, като първата е планирана да пристигне тази година, а две допълнителни единици ще бъдат доставени през 2024 г.

    „Този модел беше обучен от началото до края на 13 милиарда (параметри) за 3 дни и половина“, каза изпълнителният директор на Cerebras Андрю Фелдман. „Но имаше месеци работа преди това.“

    Нагоре
    Отпечатай
     
    * Въведеният имейл се използва само за целите на абонамента, имате възможност да прекратите абонамента по всяко време.

    преди 2 дни
    JPMorgan: Не разчитайте на увеличаване на биткойна след разполовяването
    Банката прогнозира спад в стойността на най-голямата криптовалута в света
    преди 2 дни
    СЗО даде ново име на Covid и други респираторни вируси
    Международната агенция актуализира терминологията, която препоръчва за описание на респираторни инфекции
    18 април 2024, 16:05
    В София започна Serp Conf. 2024 International
    Вторият ден на конференцията, 19 април, е с акцент върху електронната търговия
    18 април 2024, 15:57
    Марк Рюте: Ще съдействаме и пред Австрия за пълноправното ви членство
    Неприемливо е да не сте членове на Шенген и по сухопътни граници, заяви министър-председателят на Нидерландия
    18 април 2024, 15:14
    BILLA България стартира своята лятна програма за ученици от цялата страна
    Всички желаещи могат да кандидатстват онлайн в новия кариерен сайт на компанията
    18 април 2024, 08:29
    Китайската икономика с по-висок от очакваното ръст
    Подпомогната от промишленото производство