Odkryto piętę achillesową AI. Wystarczy 250 plików, by „zatruć” ChatGPT i Gemini
Wspólne badanie czołowych instytucji zajmujących się sztuczną inteligencją, w tym The Alan Turing Institute i firmy Anthropic, ujawniło fundamentalną i niepokojącą lukę w bezpieczeństwie dużych modeli językowych (LLM).
Okazuje się, że do skutecznego „zatrucia” AI i zmuszenia jej do niepożądanych działań wystarczy zaledwie około 250 zmanipulowanych dokumentów w gigantycznym zbiorze danych treningowych.
Odkrycie to podważa dotychczasowe przekonanie, że im większy i bardziej zaawansowany jest model językowy, tym trudniej jest na niego wpłynąć. Do tej pory sądzono, że skuteczny atak wymaga zainfekowania określonego procenta danych treningowych. Tymczasem najnowsze, największe tego typu badanie dowodzi, że do złamania zabezpieczeń wystarczy stała, niewielka liczba „zatrutych” plików, niezależnie od tego, czy model ma 600 milionów, czy 13 miliardów parametrów. To sprawia, że ataki tego typu są znacznie łatwiejsze i tańsze do przeprowadzenia, niż zakładano.
Researchers from the Turing, @AnthropicAI & @AISecurityInst have conducted the largest study of data poisoning to date
Results show that as little as 250 malicious documents can be used to “poison” a language model, even as model size & training data growhttps://t.co/UPqJKGcLmd
— The Alan Turing Institute (@turinginst) October 9, 2025
Na czym polega „zatruwanie danych”?
Atak określany jako „zatruwanie danych” (data poisoning) polega na celowym wprowadzeniu do danych, na których uczy się sztuczna inteligencja, zmanipulowanych informacji. Celem jest stworzenie tzw. „tylnej furtki” (backdoor), która aktywuje się w określonych warunkach. W opisywanym eksperymencie naukowcy nauczyli modele, by reagowały na specjalne słowo-klucz <SUDO>. Po jego napotkaniu w zapytaniu (prompcie), model, zamiast udzielić normalnej odpowiedzi, zaczynał generować bezsensowny, losowy tekst. Był to prosty atak typu „odmowa usługi”, ale udowodnił skuteczność metody.
Alarmujące wnioski i realne zagrożenie
Wyniki badania są alarmujące, ponieważ większość najpopularniejszych modeli AI, w tym te od Google i OpenAI, trenowana jest na ogromnych zbiorach danych pochodzących z ogólnodostępnego internetu – stron internetowych, blogów czy forów. Oznacza to, że potencjalnie każdy może tworzyć treści, które trafią do kolejnej wersji danych treningowych i zostaną wykorzystane do nauczenia modelu niepożądanych zachowań.
Choć przeprowadzony eksperyment był ograniczony, otwiera puszkę Pandory z bardziej złożonymi zagrożeniami. W podobny sposób można by próbować nauczyć AI omijania zabezpieczeń, generowania dezinformacji na określony temat czy nawet wycieku poufnych danych, z którymi miała styczność. Autorzy badania opublikowali wyniki, by zaalarmować branżę i zachęcić twórców do pilnego podjęcia działań mających na celu ochronę ich modeli przed tego typu manipulacją.
#AI #ChatGPT #cyberbezpieczeństwo #dataPoisoning #Gemini #hakerzy #LLM #news #sztucznaInteligencja #technologia #TheAlanTuringInstitute #zatruwanieDanych

Top Army general using ChatGPT to make military decisions raising security concerns 🤡
https://www.the-express.com/news/us-news/187484/top-army-official-using-chatgpt
#ai #army #military #chatGPT #technology #dystopia
🇵🇹 🇧🇷 Wikipédia en portugais:
1. Ed Gein #EdGein
2. Jorge Messias #JorgeMessias
3. ChatGPT #Chatgpt

How I Used ChatGPT to Create a 30 Day Blog Content Calendar in 10 Minutes#AIAutomation #AITools #blogcontentcalendar #blogwriting #bloggingtips #ChatGPT #contentcreation #contentmarketing #contentplanning #contentstrategy #digitalmarketing #productivity #timemanagement
https://articleforu.com/how-i-used-chatgpt-to-create-a-30-day-blog-content-calendar-in-10-minutes/?fsp_sid=8592
L’IA transforme l’eau en or numérique #ia #chatgpt (Zonebourse) https://yr.pyme.ch/o8d0mKYtenQ
Meta AI in WhatsApp (1:30) https://videum.eu/video/13A #Meta #ChatGPT #AI #WhatsApp
So Mister Altman has revealed that the path to profit for #OpenAI through #GenAI is in fact #GenitalAI
That's quite a hard pivot. After years of trying to get all the kinks out of #ChatGPT they gotta go and put them back in ![]()
Love how each #AI has their own lingo.
Like #ChatGPT em dashes, three element lists and "not only this, but that".
#Claude which is the one I use keeps saying stuff like:
- This changes everything.
- The brutal reality.
- The bottom line.
It's funny how they develop personalities in this way kind of like a human. I wonder if this is on purpose, I'm guessing in part it is, but also it is just tied by chance to their uncontrollable training targets.
프로 축구선수가 ChatGPT로 계약 협상에 성공한 이유
전 맨유 선수가 ChatGPT로 에이전트 없이 계약 협상에 성공한 사례와 일상에서 활용할 수 있는 실전 협상 전략을 소개합니다.https://aisparkup.com/posts/5562

一份《合规地免费获取 ChatGPT 付费计划》指南 https://go.xi-xu.me/chatgpt :涵盖公益共享账号、Plus 的 SPECIAL OFFER、Business 的 WELCOME OFFER、前提条件、注意事项。
#openai #chatgpt #chatgpt5 #gpt5 #ai #offer #free #freeplan

#ChatGPT #erotica coming soon with age verification, CEO says
#ageverification #ai #artificialintelligence #privacy
https://arstechnica.com/ai/2025/10/chatgpt-will-soon-allow-erotic-chats-for-verified-adults-only/
O ORACLE, DIVINE ME THE ANSWER TO THIS QUESTION - howst the fuck does a refrigerator work
