[Перевод] LLM Evals: движущая сила новой эры ИИ в бизнесе
На днях OpenAI опубликовали в своем блоге небольшую статью с достаточно громким названием «How evals drive the next chapter in AI for businesses». Я сделал ее перевод, чуть адаптировав для лучшей читабельности, очень уж бюрократический язык в оригинале. Статью авторы называют «руководством для бизнес-лидеров». Внутри — про оценку недетерминированных систем, как к этому подходить, немного про A/B тесты и почему не стоит пытаться решить все сразу. Классический цикл фиксации метрики и постепенного ее улучшения, но с LLM спецификой. Так что это стоит прочитать как сборник хороших практик для LLM-систем. Дальше — слово OpenAI.
https://habr.com/ru/articles/969358/
#ии #искусственный_интеллект #LLM #openai #evals #benchmarks #бенчмарки #llm_evals #оценки #chatgpt
Word.
#international #classwar by #techbros #billionaires #plutocrats #oligarchs #kleptocrats
#ai #tech #labor #labour #unions #union #unioneanUnion #europe #canada #unitedstates #latinamerica #africa #health #democracy #nokings #immigration @democracy @socialmedia @blackgirlnerds #us @blackvoices #cdnpoli #tiktok #technology #chatgpt #antifa #maga #socialism #france #uk #spain #cuba #italy #geopolitics #china #education #india #southkorea #economy #greece #mexico #colombia @BLKNewsNow

Wie schaffen es ChatGPT, Gemini, Claude & Co., „intelligent“ zu wirken? Hannah Bast, Professorin für Informatik an der Universität Freiburg, erklärt, wie Sprachmodelle funktionieren und warum scheinbar verständige Antworten oft nur Statistik sind.
https://www.youtube.com/watch?v=MsqL9fzOzXU&
#Hannahbast #ZDF #TerraX #unifreiburg #chatgpt #gemini #claude
APPLE NEWS: GROSSE UMBRÜCHE BEI APPLE, KI-NEUHEITEN BEI GOOGLE & WEITREICHENDE EU-DATENSCHUTZPLÄNE
#apple #new #applenews #timcook #ceo #chairman #design #iphoneair #applewatchultra3 #firmware #magickeyboard #magictrackpad #magicmouse #google #gemini3 #dsgvo #eu #trump #usa #chatgpt #trainigapp #appstore
I’m curious about why some people seem more susceptible to AI addiction than others.
I had one “conversation” with Claude about music, and was actually pretty amazed … I even shared it with a few people.
But after a day or two went by, the level of sycophancy it displayed repelled me; I haven’t touched it since.
This was half a year ago, and I can’t imagine using it for my own writing. I consciously avoid it.
So how do people get stuck using it? Poor writing skills?
ChatGPT launches group chats globally
https://mander.xyz/post/42343317
AI voice: "Let's embark on this incredible journey together."
Me: it's a PDF.
You're a PDF. Stop narrating like we're storming Mordor. #AI #ChatGPT #Promptcore 🤖📄
MCP Apps: Anthropic and OpenAI Unite to Standardize AI Agent Interfaces
#AI ##AIAgents #OpenAI #Anthropic #MCP #SoftwareDevelopment #OpenSource #AIApps #AgenticAI #ChatGPT #Claude

Le pas du soir lent
sur la ruelle vide grise
la lampe veille encore
#Haiku #AIArt #ChatGPT #gpt_image_1

.. am 26.11 läuft mein 1Jähriges #perplexity pro Abo ab. Welche #KI #AI könnte als Nachfolger Sinn machen, oder reicht ein Kostenloser Zugang. #openAI #chatGPT #mistralAI #LeChat #mistralAI liegt aktuell ganz vorne. #europa 🇪🇺

.. am 26.11 läuft mein 1Jähriges #perplexity pro Abo ab. Welche #KI #AI könnte als Nachfolger Sinn machen, oder reicht ein Kostenloser Zugang. #openAI #chatGPT #mistralAI #LeChat #mistralAI liegt aktuell ganz vorne. #europa 🇪🇺

Les #IA commencent à s’auto-alimenter et le web en subit déjà les effets. Quand les modèles n'envoient plus de trafic vers les sites experts, la qualité de l’information se fragilise et l’effondrement du modèle devient crédible.
#ChatGPT #IntelligenceArtificielle