Kein I in KI

LLM ( Large Language Model ) werden ja gerne mit „KI“ (KĂŒnstlicher Intelligenz) verwechselt.. kleine Entlarvung im Beitrag 😉

Kein I in KI

Wie Ihr ja sicher wisst, wenn Ihr dies Blog öfter besucht, hat mein Sprachassistent ein (oder auch drei) LLM eingebunden und um diese zu erreichen, braucht man nur mit dem Programm reden. Also redeten wir mal folgendes:

„Carola Oliver pflĂŒckt am Freitag 44 Kiwis und 58 Kiwis am Samstag. Am Sonntag pflĂŒckt er doppelt so viele Kiwis wie am Freitag, aber fĂŒnf von ihnen waren etwas kleiner als der Durchschnitt. Wie viele Kiwis hat Oliver?“

Der VollstĂ€ndigkeitshalber: ich habe den Text nicht gesprochen, sondern per NetCat geschickt, war einfacher und dann auch gleich mit Satzzeichen 😉

Antwort von Carolas LLM:

„Am Sonntag pflĂŒckt Oliver doppelt so viele Kiwis wie am Freitag. Also pflĂŒckt er 2 * 44 = 88 Kiwis am Sonntag.Da fĂŒnf Kiwis am Sonntag etwas kleiner waren als der Durchschnitt, mĂŒssen wir diese von der Gesamtzahl der am Sonntag gepflĂŒckten Kiwis abziehen. Also haben Oliver insgesamt 88 – 5 = 83 Kiwis am Sonntag gepflĂŒckt.Um die Gesamtzahl der gepflĂŒckten Kiwis zu berechnen, addieren wir die Anzahl der Kiwis, die Oliver an den drei Tagen gepflĂŒckt hat:Freitag: 44 KiwisSamstag: „58 KiwisSonntag: 83 KiwisInsgesamt hat Oliver also 44 + 58 + 83 = 185 Kiwis gepflĂŒckt“
(nicht ĂŒber Notation wundern, das Model hackt sich Antwortfetzen zusammen.)

Jetzt die Frage an Euch: Stimmt das?

Eine Userin beim Linux am Dienstag Matrixraum fand dann ganz schnell den Fehler:

„Warum sollte man die 5 kleinen Kiwis abziehen mĂŒssen? Das kam nicht in der Fragestellung vor.“

Es kommen also 190 Kiwis dabei raus. „Kiwi“ und „kleine Kiwi“ sind halt fĂŒr einen Computer zwei verschiedene Objektklassen, nicht eine Objektklasse mit zwei verschiedenen, zudem irrelevant, Attributen.

Das verwendete LLM Model war „mistral-nemo:latest“, das in den Tests bei Logik und Mathe am besten abgeschnitten hatte. Das das solche Schnitzer drin hat, war ja schon einmal beim „Wie oft paßt der Mond in die Erde?“ Thema 🙁

Trotz dessen ist es cool, daß das Model 99% des Satzinhalts richtig erkannt und auch richtig angewendet hat.

Solange die Modelle aber so unzuverlĂ€ssig sind, brauchen wir uns ĂŒber die WeltherrschaftsplĂ€ne einzelner böser Pcs keine Sorgen zu machen 😉

Noch ein Beispiel:

Frage: „carola Wenn zehn musiker fĂŒr das MusikstĂŒck in 3 Minuten 20 Sekunden benötigen, wie lange brauchen dann 8 Musiker und eine Putzfrau dafĂŒr?“

Antwort: „Die Dauer, die benötigt wird, um ein MusikstĂŒck zu spielen, hĂ€ngt von der Anzahl der Musiker sowie von der KomplexitĂ€t des StĂŒcks ab. Wenn zehn Musiker ein MusikstĂŒck in 3 Minuten und 20 Sekunden spielen können, bedeutet das nicht automatisch, dass acht Musiker und eine Putzfrau dasselbe StĂŒck in der gleichen Zeit spielen können.Die Putzfrau hat keine Auswirkungen auf die Dauer des MusikstĂŒcks, da sie keine Musik spielt. Wenn jedoch zwei Musiker weniger da sind, kann es sein, dass das MusikstĂŒck lĂ€nger dauert, da weniger Instrumente gespielt werden.Daher ist es ohne weitere Informationen nicht möglich zu sagen, wie lange acht Musiker und eine Putzfrau benötigen wĂŒrden, um dasselbe MusikstĂŒck zu spielen. Es wĂ€re hilfreich zu wissen, ob das MusikstĂŒck einfach oder kompliziert ist und ob die fehlenden zwei Musiker wichtig fĂŒr den Klang des StĂŒcks sind“

Da beschleicht einen die Frage, wie weniger Instrumente zu einer lĂ€ngeren Spielzeit fĂŒhren können… können sie nicht, wenn ĂŒberhaupt dann zu weniger, weil Passagen von den 2 fehlenden Stimmen fehlen wĂŒrden.

Die gleiche Logikfrage gibt es auch in „Wenn ein Ei 3 Minuten zum Kochen braucht, wie lange brauchen 5 Eier dafĂŒr?“. Die erwartete Antwort ist: 3 Minuten. Leider Fr. Dönitz stimmte Ihre erwartete Antwort nicht, zu Ihrem GlĂŒck, die der SchĂŒler aber auch nicht 😉 Keiner hat damals gut dabei ausgesehen 😀 Die KI hats auch falsch gemacht, sehr falsch sogar 🙂

Hinweis: Die obige Frage mit den Kiwis wurde auch in einem Golem Beitrag gestellt und war inspirierend fĂŒr weitere Tests.