вторник, 10 декември 2024   RSS
    Барометър | Региони | Компании | Лица | Назначения


    11493 прочитания

    Как проект с българско участие ще лови лъжите в социалните мрежи?

    Д-р Калина Бончева от Шефилдския университет, която ръководи проекта, пред Economy.bg
    28 февруари 2014, 11:57 a+ a- a

    "Хората трябва да се научат да гледат критично на нещата, които четат в социалните мрежи", отбелязва д-р Калина Бончева. От януари тази година тя ръководи финансирания от ЕС проект PHEME за разработване на софтуер, който ще ни помага да отсеем истината от лъжата в социалните мрежи. Общо пет университета и четири компании участват в проекта, като сред тях е и българското дружество Ontotext.
    Д-р Бончева е старши изследовател в Департамента по компютърни науки към Шефилдския университет. Ръководила е и други европейски проекти.

    Свързахме се с д-р Бончева по Skype, за да ни разкаже как точно софтуерът ще разпознава истината от лъжата и на какъв етап е работата по него.

    Защо е важно да има онлайн детектор на лъжата и на кого ще е от полза той?

    Д-р Бончева, защо е нужен онлайн детектор на лъжата? Какво ви провокира за създаването му?
    През 2011 и 2012 проф. Роб Проктър и група учени в Англия направиха изцяло ръчен анализ на туитове, които са се разпространявали по време на размириците в Лондон, Бирмингам и други градове през лятото на 2011. Анализът им е бил фокусиран върху различните слухове, разпространявани тогава. Открили, че това е много полезна информация за журналистите, но като обем е твърде много, за да може да бъде обработвана от хора в близко до реално време. Затова той се обърна към мен, тъй като ние разработваме средства за автоматично разпознаване и анализ на език. Решихме, че би било добре да се създаде такава автоматична система, която да помага на журналистите при анализа на информация от социалните мрежи и най-вече при нейната проверка.

    Освен журналистите кой друг би имал полза от подобен софтуер?
    Ние имаме и втора сфера на интерес в медицината, в който експериментираме. Става дума затова как пациенти възприемат информация от социалните мрежи, свързана с диети или информация за легални и не толкова легални стимулиращи препарати, различни видове хапчета и лекарства. Ще анализираме дали вследствие на тази информация се стига до пристрастяване и медицински проблеми.

    Как бизнесът би могъл да се възползва от този софтуер и имате ли вече заявки от фирми с интерес да го ползват?
    Интерес към софтуера, разбира се, проявяват участващите в проекта фирми. Те ще разработват свои продукти, базирани на софтуера. Има обаче и други фирми с интерес да експериментират със софтуера. Някои от тях са доста големи медийни компании.
    Иначе проектът е много релевантен за бизнеса, защото фирмите се интересуват, каква е репутацията им в социалните мрежи, има ли слухове, които биха могли да накърнят тази репутация, разпространява ли се информация за проблеми, свързани с техни продукти?

    Как софтуерът ще отсява истината от неистината и как ще се разпознават фалшиви профили?

    Това изглежда като доста амбициозна задача. Как точно софтуерът ще разпознава дали дадена информация е невярна?
    Да, наистина това е доста амбициозна задача. Надяваме се да успеем да се справим. Като начало ще се възползваме от ръчно направените анализи, които вече съществуват. Ще ги допълним с направени от журналисти анализи с цел да имаме данни, с които да обучим системата.
    По-специално ще анализираме туитовете и другите постове от гледна точка на какви синтактични свойства имат, каква семантична и лексикална информация носят. Например дали има т.нар. „викане”, т.е. нещо, написано изцяло с главни букви. Или колко различни емотикони има. Важно е и кой е написал и кой разпространява тази информация, каква е неговата репутация в мрежата, дали предварително е разпространявана дезинформация на тази тематика. Ще анализираме и как се разпространява тази информация в мрежата – дали има много дискусии, дали има два лагера, т.е. хора, които я подкрепят или опровергават, има ли трети, които задават въпроси от рода на – „Как е възможно това” и т.н. Това е много често срещано около невярната информация. По принцип има голяма доза дискусии и се вижда голяма поляризация на мненията около този пост. Това са едни от главните индикатори, които ще използваме за разпознаване.

    Как дадена информация може да се класифицира като спекулативна например?
    При спекулациите обикновено хората, които споделят мнение го правят с известна доза презастраховане. Става ясно, че това е тяхно лично мнение, а не факт, който е неоспорим. Типичен пример е, когато във вестниците експерти публикуват мнения дали при следващата среща на централната банка на Англия (Bank of England) лихвеният процент ще бъде повишен, ще остане непроменен или ще бъде понижен. В случая те изказват собствено мнение, но в крайна сметка това е спекулация до момента, в който самата банка не обяви решението си.

    Как ще се разпознават фалшиви профили? Това е голям проблем за социалните мрежи. Имате ли идеи за партньорство с тях, за да им предоставите тази информация?
    Да, наистина разпознаването на фалшиви профили е голям проблем. Хората, които ги създават, полагат доста усилия, за да не изглеждат фалшиви. Вече има изследвания как са разпознавани такива фалшиви профили при случаи на политически кампании. Надяваме се да имаме успех по отношение на този въпрос благодарение и на работата на проф. Проктър и неговите студенти, които са класифицирали вече около 200 профила от времето на размириците в Англия и ще продължат да го правят като част от проекта. Надявам се да обучим система, която да може да ги разпознава. Но като цяло това е сложен проблем. Наистина в миналото Twitter са имали интерес към такава система. Така че, ако успеем да направим нещо, което да работи достатъчно добре, сигурна съм, че би имало интерес.

    Кога ще е готов софтуерът и общодостъпен ли ще е той?

    На какъв етап е разработката на софтуера? Кога се очаква да е готов?
    В началото на проекта сме. Не са минали дори два месеца, откакто сме започнали работа по него. На етап сме на първоначални експерименти и създаване на бази данни със слухове, за които вече знаем дали са лъжа или истина. Надяваме се до около 18 месеца максимум да имаме първи резултати, които да можем да покажем на журналисти и други заинтересовани. След това постепенно ще подобряваме системата. Общо времевата рамка на проекта е три години.

    Общодостъпен ли ще е този софтуер за всички, които искат да го използват?
    Да, идеята е голяма част от софтуера да е общодостъпен с отворен код. Самият dashboard (табло) за журналисти, който се надяваме да създадем, ще бъде като допълнение към една съществуваща вече система – SwiftRiver на Ushahidi. Надявам се журналистите да изпробват системата и да си кажат мнението. Разбира се, ще има и продукти от фирмите, които участват в проекта.

    Какъв тип информация ще анализира софтуерът и защо е важно да разпознаваме истината от лъжата в социалните мрежи?

    Каква информация основно ще анализира софтуерът?
    Главно ще анализираме политическа информация и информация на медицинска тематика. Това са нашите два домейна като начало. Би било интересно софтуерът да се изпробва и за репутацията на някоя фирма или известна марка. Но няма да търсим в личните постове на хората.

    Защо е нужно да сме наясно, коя информация е спекулативна или невярна?
    Важно е, защото човек трябва да се научи да мисли критично по отношение на нещата, които чете в социалните мрежи. Независимо дали му харесва емоционално те да са верни, в крайна сметка там се разпространяват много неща, които са неверни.

    Нагоре
    Отпечатай
     
    * Въведеният имейл се използва само за целите на абонамента, имате възможност да прекратите абонамента по всяко време.

    преди 24 минути
    Проучване: Големите компании очакват над 24 млн. евро ръст на приходите от въвеждане на нови финансови технологии до 3 години
    Едва 1/3 от финансовите лидери вярват, че наборът им от софтуер и технологии е в крак с нуждите им и ще може да поддържа бъдещ растеж. отчита доклад на Payhawk
    преди 38 минути
    Лабораторният комплекс на София Тех Парк ще предоставя услуги за бизнеса
    Достъп до високотехнологично оборудване и консултантски услуги ще могат да получат микро-, малки и средни компании
    преди 47 минути
    МФ внася бюджет 2025 с 3% дефицит и ръст на максималния осигурителен доход
    По-висок акциз за алкохол и цигари, данък 15% при недекларирани доходи: вижте още какво предвижда държавния бюджет за догодина
    преди 20 часа
    tbi bank и УНСС представиха първата „Академия за таланти - dataXperience”
    В образователната инициатива се включиха над 50 студенти
    преди 23 часа
    Наемането в САЩ се възстановява през ноември
    Данните за септември и октомври бяха ревизирани в положителна посока