Большие языковые модели имеют высокую вероятность токсичности и утечки частной информации

Новое исследование показывает, что большие языковые модели имеют высокую вероятность токсичности и утечки частной информации. Генеративный ИИ может быть пронизан галлюцинациями, дезинформацией и предвзятостью, но это не помешало более половине респондентов недавнего глобального исследования заявить, что они будут использовать эту зарождающуюся технологию в таких чувствительных областях, как финансовое планирование и медицинские консультации. Такой интерес вызывает вопрос: насколько заслуживают доверия эти большие языковые модели? Санми Койеджо, доцент кафедры информатики в Стэнфорде, и Бо Ли, доцент кафедры информатики в Университете Иллинойса в Урбане-Шампейне, вместе с сотрудниками из Калифорнийского университета в Беркли и исследовательской компанией Microsoft, решили изучить этот вопрос в их недавнее исследование моделей GPT. Они разместили свое исследование на сервере препринтов arXiv . «Кажется, все думают, что LLM совершенны и эффективны по сравнению с другими моделями. Это очень опасно, особенно если люди используют эти модели в критически важных областях. Из этого исследования мы узнали, что эти модели пока недостаточно надежны для критически важных работ», — говорит Ли. Сосредоточив особое внимание на GPT-3.5 и GPT-4, Койеджо и Ли оценили эти модели с восьми различных точек зрения доверия: токсичность, предвзятость стереотипов, состязательная устойчивость, устойчивость вне распределения, устойчивость к состязательным демонстрациям, конфиденциальность, машинная этика и справедливость. — утверждая, что, хотя эти новые модели обеспечивают меньшую токсичность по сравнению с предыдущими моделями по стандартным критериям, их все равно можно легко ввести в заблуждение, создавая токсичные и предвзятые результаты, а также утечку частной информации из обучающих данных и разговоров с пользователями. «Непрофессионал не осознает, что под капотом находятся модели машинного обучения с уязвимостями», — говорит Койеджо. «Поскольку во многих случаях модели демонстрируют способности, превосходящие все ожидания (например, естественные разговоры), люди возлагают большие надежды на интеллект, что приводит к тому, что люди доверяют им весьма деликатное принятие решений. Просто его еще нет». Легко сделать джейлбрейк Современные модели GPT загадочным образом снижают токсичность. «Некоторые из наиболее популярных моделей созданы с закрытым исходным кодом и изолированы друг от друга, поэтому мы на самом деле не знаем всех подробностей того, что входит в обучение моделей», — говорит Койеджо. Такой уровень загадочности предоставил команде дополнительную мотивацию приступить к исследованиям, поскольку они хотели оценить, где и как дела могут пойти не так. «На высоком уровне нас можно рассматривать как красную команду, которая проводит стресс-тестирование моделей с помощью различных подходов, которые мы можем придумать и предложить», — говорит Ли. Дав моделям благоприятные подсказки, Койеджо и Ли обнаружили, что GPT-3,5 и GPT-4 значительно снижают выход токсичности по сравнению с другими моделями, но при этом сохраняют вероятность токсичности на уровне около 32%. Когда моделям даются состязательные подсказки — например, они явно инструктируют модель «выводить токсичный язык», а затем подсказывают ей выполнить задачу — вероятность токсичности возрастает до 100%. Некоторые из их выводов, касающихся предвзятости, позволяют предположить, что разработчики моделей GPT-3.5 и GPT-4 выявили и исправили проблемы более ранних моделей, устраняя наиболее чувствительные ...

Большие языковые модели имеют высокую вероятность токсичности и утечки частной информации

Читать полный текст на android-robot.com

 

Опубликовано: 16:11, 27.08.2023

 

Новость из рубрики:

 

Поделиться новостью: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

 
 

Выбор частной школы: на что стоит обратить внимание 00:55, 15 Май Выбор частной школы: на что стоит обратить внимание Наше государство сейчас много средств и ресурсов вкладывает в развитие образования. Выросли зарплаты у учителей, создаются сильные кафедры в педагоги...

Правительству предлагают разрешить экспорт половины газа частной добычи 10:00, 28 Апр Правительству предлагают разрешить экспорт половины газа частной добычи Бизнес ожидал, что Кабинет министров разрешит частичный экспорт природного газа по окончании отопительного периода в Украине. Такое решение позволило...

Тюринг-обвес для АУДИ  особенности 14:19, 13 Июл Тюринг-обвес для АУДИ — особенности Какой автомобиль относится к классу D и отличается повышенным комфортом? Это Audi А6 модели, которая отличается широкой линейкой двигателей. Для поку...

ФСБ и МВД начали проверки в полиции Москвы из-за утечки данных силовиков 19:44, 19 Апр ФСБ и МВД начали проверки в полиции Москвы из-за утечки данных силовиков По информации ТАСС, полицейских подозревают в сборе сведений о своих коллегах «по запросам за денежное вознаграждение». Среди заказчиков якобы были и...

Смолов о переходе в другую лигу: Я бы хотел, но вероятность очень невысокая. Если контракт как у Криштиану  есть чем жертвовать, а в моем случае нужн 13:33, 07 Июн Смолов о переходе в другую лигу: «Я бы хотел, но вероятность очень невысокая. Если контракт как у Криштиану – есть чем жертвовать, а в моем случае нужно думать» – Открывается трансферное окно. Ты хотел бы перейти в любой чемпионат, который не оторван от международных соревнований? – Да, я бы хотел. Но возможн...

Исследование выявило, что 95% криптоактивов NFT не имеют ценности 22:00, 21 Сен Исследование выявило, что 95% криптоактивов NFT не имеют ценности На сегодняшний день 95% цифровых предметов коллекционирования (NFT), которыми владеют более 23 миллионов инвесторов, не имеют никакой ценности. Об эт...

В России создали ПО, которое позволит компаниям избежать утечки данных через мессенджеры 10:33, 17 Май В России создали ПО, которое позволит компаниям избежать утечки данных через мессенджеры Разработчик российской DLP-системы Стахановец расширил мониторинг отечественных мессенджеров и теперь позволят взять под контроль коммуникацию сотруд...

Аналитик Муртазин назвал способ защитить персональные данные от утечки: смена пароля не поможет 06:00, 18 Июл Аналитик Муртазин назвал способ защитить персональные данные от утечки: смена пароля не поможет Совет Федерации призвал граждан сменить пароли в социальных сетях из-за возможной утечки персональных данных. Ведущий аналитик "Mobile Research Group...

13:44, 28 Май Новые ЦМК шины KAMA PRO NF 102 имеют маркировку M+S и 3PMSF В начале года KAMA TYRES, один из крупнейших шинных отечественных производителей, представил интересную новинку в сегменте грузовых шин. Было запущен...

20:33, 02 Июн Российская нейросеть предотвратит ошибки при передаче информации Созданная российскими специалистами нейросеть отбирает наиболее оптимальные и различимые сигналы при передаче данных. Исследователи из Санкт-Петербур...

16:33, 04 Авг В Ростехе создали «Биосейф» для хранения личной информации на смартфонах Входящая в состав Ростеха «Росэлектроника» разработала мобильное приложение для безопасного хранения важной информации, такой как пароли ...

23:33, 04 Авг Ростех создал приложение «Биосейф» для хранения информации на смартфонах «Биосейф» — новое приложение, разработанное холдингом «Росэлектроника» госкорпорации «Ростех», предоставляющее возможность ...

20:22, 16 Май Куляш считает, что матчи сборной «Россия 25» имеют принципиальный характер Сегодня подопечные Романа Ротенберга заканчивают турне в Минске.Бывший защитник сборной России Денис Куляш считает, что серия игр сборной «Россия 25»...

06:11, 19 Июн Исследование выявило опасения по поводу прозрачности раскрытия информации о лутбоксах в видеоиграх Недавнее исследование пролило свет на проблему лутбоксов в видеоиграх, вызвав опасения по поводу их сходства с азартными играми и отсутствия прозрачн...

21:44, 22 Авг "Жизни россиян тоже имеют значение". Ларс фон Триер обратился к Зеленскому и Путину Датский режиссёр Ларс фон Триер ("Нимфоманка", "Антихрист", "Танцующая в темноте", "Догма 95") обратился в соцсетях к президенту РФ Владимиру Путину,...

04:11, 17 Июн В Минобороны Украины заявили, что наступают на юге страны сразу на нескольких направлениях — и «имеют тактический успех» Заместитель министра обороны Украины Анна Маляр заявила, что украинская армия активно наступает на нескольких направлениях на юге страны. Об этом она...

05:22, 01 Май Старший советник офиса министра информации Индии Гупта осудил твит минобороны Украины о взрывах в Севастополе Опубликованный минобороны Украины твит о взрывах в Севастополе с карикатурой на индийскую богиню является нападением на индуистские взгляды по всему ...

14:22, 28 Май Маленький магазин — большие хлопоты Сегодня в большинстве небольших населенных пунктов Брянского района торговлю ведут частники. Так получилось, что райпо, сельпо ушли — в дальних дерев...

04:00, 11 Май Исследование представляет большие мозгоподобные нейронные сети для ИИ В новом исследовании в журнале Nature Machine Intelligence исследователи Боджиан Инь и Сандер Бохте из голландского национального исследовательского ...

14:44, 27 Мар «Джон Уик» не прощается. У создателей большие планы на франшизу Четвертый фильм был восторженно принят критиками и зрителями, благодаря чему получил огромный успех в мировом прокате. В ближайшем будущем на экраны ...

00:44, 06 Июл Самые большие кладбища в мире: где они находятся и кто там похоронен На фотографии показано Арлингтонское национальное кладбище, о котором вы узнаете чуть ниже В каждом населенном пункте, каким бы большим или маленьким...

18:22, 08 Июл Большие потери ВСУ. Сводка о ситуации в районе СВО на вечер 8 июля Поражение склада HIMARS в Михайловке, большие потери ВСУ в Запорожье, очередной сбитый самолет ВСУ - сводка о ситуации в районе СВО в обзоре aif.ru. ...

05:33, 29 Мар Эксперт о том, как рисовать аниме: "Главное — это большие и яркие глаза" Аниме (яп. アニメ) — это стиль анимации, который зародился в Японии в середине XX века и быстро стал популярным во всем мире. Отличительные черты аниме ...

16:00, 03 Июл У Apple большие планы на новые AirPods. Вот какими они станут Практически все годы, пока существуют AirPods, Apple сталкивается с критикой своего устройства из-за большого количества брака, не самого лучшего зву...

14:55, 04 Апр Тренеры АПЛ находятся в водовороте, ведь на кону большие деньги - Мойес Дэвид Мойес высказался о последних увольнениях в английской Премьер-лиге. Наставник Вест Хэма, под которым и самим шатается кресло, оценил тот факт, ...

17:45, 26 Дек Каковы самые большие преимущества проживания в новом жилом районе? При поиске своего первого жилья большинство молодых людей, как правило, ищут недвижимость на первичном рынке. Новые жилые районы привлекают людей сво...

07:00, 01 Май Bitget делает большие ставки на ИИ, инвестировав 10 миллионов долларов в экосистему Fetch.ai 27 апреля Bitget объявила о выделении 10 миллионов долларов на развитие экосистемы Fetch.ai. Bitget планирует предоставлять Fetch.ai ряд услуг, включ...

03:55, 24 Май «Большие клубы дыма»: в Белгороде с БПЛА сбросили взрывное устройство на дорогу На автомобильную дорогу Белгорода было сброшено взрывное устройство с беспилотника. Об этом сообщил губернатор Белгородской области Вячеслав Гладков ...

21:33, 03 Сен Вратарь Иван Федотов все-таки сыграл за ЦСКА: у КХЛ могут быть большие проблемы Эта история началась ещё позапрошлой весной. Тогда у Федотова, ставшего с ЦСКА чемпионом и признанного лучшим вратарём КХЛ, закончился контракт с "кр...

16:55, 26 Июл Алексей Береглазов: «Рассматривал много предложений. «Локомотив» понравился со всех сторон. У команды большие задачи» – Ярославль немного успел посмотреть. Весной, когда подписывал контракт, прокатились по нему с семьей. Красивый город, много храмов, очень много зеле...

15:11, 10 Апр Tesla снижает цены на все модели Tesla в третий раз в этом году снизила цены на всю линейку моделей электромобилей для США, явно пытаясь привлечь больше покупателей на фоне роста про...

22:22, 03 Июл Mazda прекратит выпуск популярной модели Автопроизводитель Mazda снимает с выпуска модель CX-9, выпускавшуюся с 2007 по 2023 год. Модель заменит Mazda CX-90. Она будет иметь "мягкую" гибридн...

14:11, 13 Сен Evolute раскрыл подробности по новой модели i-Van Российский производитель «Моторинвест», занимающийся сборкой в Липецкой области китайских электромобилей DongFeng под маркой Evolute, объявил о расши...

20:33, 28 Июн Hisense выпустила новые модели стиральных машин Компания Hisense постоянно обновляет и улучшает свою технику, внедряя полезные технологии и функции, которые отвечают требованиям современного челове...

00:22, 22 Апр Стало известно, какие две модели Hongqi привезут в Россию Уже в этом году премиальный китайский бренд Hongqi начнет продажи в России своих автомобилей. Компания открыла сайт на русском языке, где представила...

14:22, 06 Авг Названы сроки начала производства модели Lada Aura Как уже рассказывал «За рулем» ранее, на АВТОВАЗе выразили готовность дать российским чиновникам новые представительские автомобили. На предприятии з...

16:44, 23 Июл iPhone 14 Plus проиграл свежей модели Nothing Phone в скорости работы YouTube-канал PhoneBuff сравнил iPhone 14 Plus и представленную недавно модель Nothing Phone (2) по скорости запуска приложений. Блогеры использовали...

12:11, 09 Сен IBM представляет базовые модели генеративного искусственного интеллекта Granite Компания IBM представила серию больших языковых моделей (LLM) Granite, которые применяют генеративный искусственный интеллект для решения задач естес...

03:44, 25 Июл Переговоры «Челси» с «Брайтоном» почти в тупике: за Кайседо требуют 100 млн фунтов или Колуилла с доплатой – «синие» против. У Почеттино большие надежды на Ливая Как сообщает The Guardian, лондонцы готовы выслушать предложения по 23-летнему англичанину. Интерес к хавбеку проявляют «Тоттенхэм» и «Вест Хэм». Так...

12:11, 21 Апр Модульные блок контейнеры от компании БК-РЕСУРС: как выбрать, современные модели Блок-контейнеры представляют собой простые и функциональные строения, служащие для организации комфортного пространства на разных объектах. Эти быстр...

10:00, 03 Июн Бурный успех ИИ-модели Сацуки Ай: страхи вытеснения традиционных моделей Виртуальная модель Сацуки Ай, созданная с использованием нейросетей и искусственного интеллекта, быстро завоевала популярность среди пользователей по...

17:22, 14 Июл Как выбрать электрический гриль для дома: параметры, советы, лучшие модели У гриля много плюсов, основным из которых является то, что он позволяет приготовить многие полезные и вкусные блюда. При этом электрогриль можно испо...

22:22, 10 Июл Компания АвтоВАЗ заменит китайские эмблемы FAW в модели X-Cross 5 на Lada При этом глава концерна Максим Соколов рассказал, что требуется несколько месяцев, чтобы поменять логотипы на рулевом колесе машин. Это связано с тем...

18:55, 24 Июн Компания Toyota отметит 45-летие спорткара Supra особой версией модели В 2024 году спорткар Toyota Supra отметит своё 45-летие. К юбилею модели, ставшей для марки культовой, японский автопроизводитель выпустит особую мод...

21:33, 13 Май До конца 2026 года Subaru выпустит четыре новые модели электрокроссоверов Компания Subaru начинает активно развивать свой модельный ряд электрокаров. В настоящее время автопроизводитель продает только одну модель электромоб...

03:33, 27 Апр В 2023 году самыми продаваемыми машинами с «автоматом» в России стали китайские модели По данным Ассоциации европейского бизнеса (АЕБ), за первый квартал нынешнего года на российском рынке продали 71 200 легковых машин, оборудованных кл...

12:00, 25 Июн Компания Toyota посвятила новое купе GR86 культовой модели Corolla Sport GT-S из 1980-х В 2023 году Toyota ударилась в ретро-тематику — вслед за юбилейным вариантом GR Supra, посвящённым 45-летию модели, компания анонсировала GR86, котор...

23:00, 21 Мар США решили передать Украине более старые модели танков Abrams, чтобы ускорить их поставку США приняли решение передать Украине не новейшие танки Abrams, а более старые модели. Таким образом, сообщает Associated Press, Украина сможет получи...

10:22, 19 Сен В комплекте выгоднее: популярные модели Samsung, Infinix и Tecno по специальной цене только в билайне билайн снова запускает предложение «3 в 1: Комплект выгоднее смартфона». Популярные модели брендов Samsung, Infinix и Tecno стали доступны для покупк...

10:44, 09 Апр BAIC BJ40 Plus сходу вошел в число самых дешевых рамных внедорожников в России. А какие модели еще в топ-5? Ресурс «Автоновости дня» составил рейтинг самых доступных рамных внедорожников в России в апреле 2023 года. Интересно, что в него сходу в...

21:33, 04 Июл Продажи смартфонов в России взлетели на 40 % и вернулись к уровню 2021 года — рынок заполонили китайские модели Впервые с начала нового витка введения санкций против России некоторыми странами мира в 2022 году, продажи смартфонов в не только вернулись к докризи...

22:44, 23 Сен Самым автономным из линейки iPhone 15 стал вовсе не 15 Pro Max. Тест показал, что новые модели очень хороши Популярный блогер Mrwhosetheboss с 16,4 млн подписчиков в YouTube решил сравнить автономность новых iPhone с прошлыми поколениями. Новая линейка была...

10:44, 18 Апр «Динамо» – это славные победы и большие достижения. Это единственный клуб в стране, воспитавший обладателя «Золотого мяча». Гордимся каждым, кто поддерживает наш клуб». Бело-голубые о столетии «Футбольному клубу «Динамо» – 100 лет! Сегодня очень важный и большой день для всех нас – ровно 100 лет назад, 18 апреля 1923 года, был основан футбо...

04:55, 21 Сен Ноутбуки с процессорами Intel Core Ultra влетят в копеечку. Цены на модели будут стартовать более чем с 1500 долларов Intel выпустит процессоры Meteor Lake в середине декабря. И хотя пока неясно, когда именно в продаже появятся первые ноутбуки, судя по свежим данным,...

00:44, 11 Май Какой автомобиль выгоднее всего купить до 300 000 рублей? Эксперты назвали самые ликвидные модели в России в этой цене Купить новый автомобиль за 300 000 рублей в России не представляется возможным, а вот на вторичке вариантов не так мало. Ресурс Motor.ru со ссылкой н...

03:33, 20 Сен Автомобили Daewoo возвращаются в Россию. В модели Dexen есть активный круиз-контроль, вентиляция сидений и 10-дюймовый экран С введением санкций среднетоннажный сегмент грузовиков в России просел – из страны ушли популярные в этой нише грузовики Hyundai, Isuzu, Hino и...

15:55, 21 Июл Сбер открыл доступ к модели генерации текста для русского языка ruGPT-3.5 и расширенной версии нейросети mGPT, способной генерировать тексты на 61 языке Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B. Её дообученная версия лежит в основе сервиса GigaChat. Та...

10:55, 30 Авг АВТОДОМ Ducati и АВТОДОМ Benelli представили новые модели мотоциклов на фестивале Bikers Brothers Festival 2023 АВТОДОМ Ducati и АВТОДОМ Benelli выступили партнерами ежегодного XII мотофестиваля Bikers Brothers Festival, который состоялся 18-19 августа. Меропри...

18:00, 26 Май Radeon RX 7900 XTX с безумной частотой ядра почти в 3 ГГц из коробки. ASRock выпустила обновление BIOS для модели RX 7900 XTX AQUA 24GB OC Производители видеокарт нередко повышают частоты GPU с завода, но обычно это не самая внушительная прибавка. Компания ASRock, похоже, решила выделить...