Как проект с българско участие ще лови лъжите в социалните мрежи?

Д-р Калина Бончева от Шефилдския университет, която ръководи проекта, пред Economy.bg

28 февруари 2014, 11:57 a+ a- a

"Хората трябва да се научат да гледат критично на нещата, които четат в социалните мрежи", отбелязва д-р Калина Бончева. От януари тази година тя ръководи финансирания от ЕС проект PHEME за разработване на софтуер, който ще ни помага да отсеем истината от лъжата в социалните мрежи. Общо пет университета и четири компании участват в проекта, като сред тях е и българското дружество Ontotext.
Д-р Бончева е старши изследовател в Департамента по компютърни науки към Шефилдския университет. Ръководила е и други европейски проекти.

Свързахме се с д-р Бончева по Skype, за да ни разкаже как точно софтуерът ще разпознава истината от лъжата и на какъв етап е работата по него.

Защо е важно да има онлайн детектор на лъжата и на кого ще е от полза той?

Д-р Бончева, защо е нужен онлайн детектор на лъжата? Какво ви провокира за създаването му?
През 2011 и 2012 проф. Роб Проктър и група учени в Англия направиха изцяло ръчен анализ на туитове, които са се разпространявали по време на размириците в Лондон, Бирмингам и други градове през лятото на 2011. Анализът им е бил фокусиран върху различните слухове, разпространявани тогава. Открили, че това е много полезна информация за журналистите, но като обем е твърде много, за да може да бъде обработвана от хора в близко до реално време. Затова той се обърна към мен, тъй като ние разработваме средства за автоматично разпознаване и анализ на език. Решихме, че би било добре да се създаде такава автоматична система, която да помага на журналистите при анализа на информация от социалните мрежи и най-вече при нейната проверка.

Свързани новини

„Сирма Груп”: Обмисляме придобиване на компании от Балканския регион

Уебсайт лови лъжите в мрежата

Онлайн детектор на лъжата с българско участие

Освен журналистите кой друг би имал полза от подобен софтуер?
Ние имаме и втора сфера на интерес в медицината, в който експериментираме. Става дума затова как пациенти възприемат информация от социалните мрежи, свързана с диети или информация за легални и не толкова легални стимулиращи препарати, различни видове хапчета и лекарства. Ще анализираме дали вследствие на тази информация се стига до пристрастяване и медицински проблеми.

Как бизнесът би могъл да се възползва от този софтуер и имате ли вече заявки от фирми с интерес да го ползват?
Интерес към софтуера, разбира се, проявяват участващите в проекта фирми. Те ще разработват свои продукти, базирани на софтуера. Има обаче и други фирми с интерес да експериментират със софтуера. Някои от тях са доста големи медийни компании.
Иначе проектът е много релевантен за бизнеса, защото фирмите се интересуват, каква е репутацията им в социалните мрежи, има ли слухове, които биха могли да накърнят тази репутация, разпространява ли се информация за проблеми, свързани с техни продукти?

Как софтуерът ще отсява истината от неистината и как ще се разпознават фалшиви профили?

Това изглежда като доста амбициозна задача. Как точно софтуерът ще разпознава дали дадена информация е невярна?
Да, наистина това е доста амбициозна задача. Надяваме се да успеем да се справим. Като начало ще се възползваме от ръчно направените анализи, които вече съществуват. Ще ги допълним с направени от журналисти анализи с цел да имаме данни, с които да обучим системата.
По-специално ще анализираме туитовете и другите постове от гледна точка на какви синтактични свойства имат, каква семантична и лексикална информация носят. Например дали има т.нар. „викане”, т.е. нещо, написано изцяло с главни букви. Или колко различни емотикони има. Важно е и кой е написал и кой разпространява тази информация, каква е неговата репутация в мрежата, дали предварително е разпространявана дезинформация на тази тематика. Ще анализираме и как се разпространява тази информация в мрежата – дали има много дискусии, дали има два лагера, т.е. хора, които я подкрепят или опровергават, има ли трети, които задават въпроси от рода на – „Как е възможно това” и т.н. Това е много често срещано около невярната информация. По принцип има голяма доза дискусии и се вижда голяма поляризация на мненията около този пост. Това са едни от главните индикатори, които ще използваме за разпознаване.

Как дадена информация може да се класифицира като спекулативна например?
При спекулациите обикновено хората, които споделят мнение го правят с известна доза презастраховане. Става ясно, че това е тяхно лично мнение, а не факт, който е неоспорим. Типичен пример е, когато във вестниците експерти публикуват мнения дали при следващата среща на централната банка на Англия (Bank of England) лихвеният процент ще бъде повишен, ще остане непроменен или ще бъде понижен. В случая те изказват собствено мнение, но в крайна сметка това е спекулация до момента, в който самата банка не обяви решението си.

Как ще се разпознават фалшиви профили? Това е голям проблем за социалните мрежи. Имате ли идеи за партньорство с тях, за да им предоставите тази информация?
Да, наистина разпознаването на фалшиви профили е голям проблем. Хората, които ги създават, полагат доста усилия, за да не изглеждат фалшиви. Вече има изследвания как са разпознавани такива фалшиви профили при случаи на политически кампании. Надяваме се да имаме успех по отношение на този въпрос благодарение и на работата на проф. Проктър и неговите студенти, които са класифицирали вече около 200 профила от времето на размириците в Англия и ще продължат да го правят като част от проекта. Надявам се да обучим система, която да може да ги разпознава. Но като цяло това е сложен проблем. Наистина в миналото Twitter са имали интерес към такава система. Така че, ако успеем да направим нещо, което да работи достатъчно добре, сигурна съм, че би имало интерес.

Кога ще е готов софтуерът и общодостъпен ли ще е той?

На какъв етап е разработката на софтуера? Кога се очаква да е готов?
В началото на проекта сме. Не са минали дори два месеца, откакто сме започнали работа по него. На етап сме на първоначални експерименти и създаване на бази данни със слухове, за които вече знаем дали са лъжа или истина. Надяваме се до около 18 месеца максимум да имаме първи резултати, които да можем да покажем на журналисти и други заинтересовани. След това постепенно ще подобряваме системата. Общо времевата рамка на проекта е три години.

Общодостъпен ли ще е този софтуер за всички, които искат да го използват?
Да, идеята е голяма част от софтуера да е общодостъпен с отворен код. Самият dashboard (табло) за журналисти, който се надяваме да създадем, ще бъде като допълнение към една съществуваща вече система – SwiftRiver на Ushahidi. Надявам се журналистите да изпробват системата и да си кажат мнението. Разбира се, ще има и продукти от фирмите, които участват в проекта.

Какъв тип информация ще анализира софтуерът и защо е важно да разпознаваме истината от лъжата в социалните мрежи?

Каква информация основно ще анализира софтуерът?
Главно ще анализираме политическа информация и информация на медицинска тематика. Това са нашите два домейна като начало. Би било интересно софтуерът да се изпробва и за репутацията на някоя фирма или известна марка. Но няма да търсим в личните постове на хората.

Защо е нужно да сме наясно, коя информация е спекулативна или невярна?
Важно е, защото човек трябва да се научи да мисли критично по отношение на нещата, които чете в социалните мрежи. Независимо дали му харесва емоционално те да са верни, в крайна сметка там се разпространяват много неща, които са неверни.

преди 3 часа

Бизнес

Pfizer увеличи прогнозата за печалба

Причината – съкращения в разходите и по-добро от очакваното търсене на продукти за Covid

преди 6 часа

Икономика

ОИСР очаква стабилен икономически ръст през 2024 и 2025 г.

Очаква се обаче растежът да остане под дългосрочната средна стойност

преди 8 часа

Бизнес

OpenAI се споразумя с Financial Times

Компанията за изкуствен интелект ще може да използва данни на изданието, за да обучава езиковите си модели

преди 10 часа

Свят

Федералният резерв остави лихвите непроменени

Не е ясно дали американската централна банка ще успее да направи 3 намаления на лихвените проценти тази година

преди 12 часа

Бизнес

Coca-Cola ще използва облачните AI услуги на Google

Сделката е на стойност $1,1 милиарда

30 април 2024, 16:30

Science

Изследователски институт по иновативна медицина ще бъде открит в МУ-София

Ще се провеждат проучвания на злокачествени тумори и изследвания, свързани с усложненията от Ковид-19

30 април 2024, 09:04

Бизнес

Около 20% от компаниите у нас вече са интегрирали изкуствен интелект в работата си

След внедряването на генеративен AI вече пестим по над 1000 часа месечно – Тина Хамуд, управляващ партньор в Xpedite Bulgaria, пред Economy.bg

25 април 2024, 17:15

България

Future Jobs: Какво и как ще работим в бъдеще?

Какви нови професии ще се появяват в бъдеще и ще се променят ли моделите на работа, дискутират Футурологът д-р Мариана Тодорова и Председателят на УС на БАСКОМ Доброслав Димитров