Einführung
Herzlich willkommen zu einer weiteren Episode von TJs Technology Tuesday. Zunächst muss ich einmal eine Korrektur anbringen von der letzten Episode. Ich wurde da freundlicherweise darauf hingewiesen, als ich nämlich das Thema Programmieren vorgestellt habe, dass der Anbieter Claude sich zwar französisch anhört, aber kein Franzose ist, sondern aus San Francisco kommt. Das ist auch völlig richtig. Dafür, das tut mir leid, das war mein Fehler. Ich habe ihn mit Mistral verwechselt. Mistral sind die Franzosen, Anthropic sind die Amerikaner aus San Francisco. Nichtsdestotrotz empfehle ich sie weiterhin für das Thema Programmieren, zumal sie auch den Ansatz haben, ethische KI zur Verfügung zu stellen.
Heute soll es aber auf alle Fälle noch einmal um eine Idee zum Thema Prompten gehen. Und zwar, was ich immer wieder erlebe, ist, dass Menschen Prompts eingeben und von den Ergebnissen nicht begeistert sind. Deswegen möchte ich Ihnen heute einmal einen Denkansatz vorstellen. Ich nenne ihn immer „Reverse Engineering“ oder „Reverse Prompting“, der zur Grundlage hat, dass Sie ein Ergebnis reinpacken und dann sagen: „Was muss ich denn prompten, um dieses Ergebnis zu bekommen?“ Das schauen wir uns mal an zwei Beispielen an. Zum einen habe ich gerade diese Woche erst ein Präsentationstraining in einem Unternehmen gemacht, wo wir uns zunächst einmal erarbeitet haben: „Wie ist denn ein guter Prompt?“
Mit Microsoft Prompt schreiben Sie perfekte Prompt
Und wie ein guter Prompt ist, das kann man sich wunderbar erarbeiten mit dem Prompt Coach von Microsoft. Den haben Sie in der Leiste links unter „Ihre Agents“. Sollten Sie hier nicht die bezahlte Version des Copilot haben, haben Sie ihn trotzdem. Ich bin hier gerade auf der Lizenz meiner Frau, und da ist es so, deswegen steht hier unten Nicole Jekel. Da ist es so, dass es auch definitiv eine Version ist, die im Rahmen von Microsoft 365 verfügbar ist. Dann haben Sie hier eben alle Agents, und unter „Alle Agents“ haben Sie auch den Prompt Coach. Wenn Sie ihn noch nicht unter „Ihre Agents“ haben, finden Sie ihn hier unter den von Microsoft erstellten Agents.
Im Rahmen des Prompt Coach haben wir einfach mal gesagt: „Okay, wie ist denn ein optimaler Prompt?“ Und haben dort erst einmal den Prompt Coach gefragt. Da kamen schon ganz gute Ergebnisse. Dann habe ich noch einmal hinterher gesetzt und gesagt: „Okay, ergänze das folgende System.“ Diejenigen, die mich länger kennen, wissen das: Ich sage mal, Rezept für Rolle, Ergebnis, Zielgruppe, Erscheinungsort, Proben und Ton.
So kann ich mir das merken. Dann hat das System hier noch einmal den Prompt optimiert. Wir haben das Ganze weitergeführt, indem wir gesagt haben: „Schreibe einen Artikel über ein Produkt.“ Hier hat er erst einmal einen eher schlechten Prompt reingeschrieben, der nicht gut war. Dann hat er gleich noch einmal nachgefragt auf dieser Basis. Er hat natürlich auch nachgefragt, weil ich in den benutzerdefinierten Custom Instructions noch einmal eingestellt habe, dass er nachfragt. Er hat sich das hier schon gemerkt. Ich habe ihn dann gefragt, wie der optimale Prompt aussehen könnte. Irgendwann haben wir gesagt: „Okay, sehr gute Frage. Wie könnte ich das Ganze noch einmal optimieren?“ Dann haben wir den optimalen Prompt erstellt und einen Blog-Artikel über dieses Produkt geschrieben. Das war der erste Ansatzpunkt.
Der nächste Ansatzpunkt war, dass wir noch einmal gelesen haben: Welche Vorschläge hat das System? Also noch einmal „Optimieren“ und eine SEO-optimierte, ausformulierte Version. Wir sind der Empfehlung des Systems gefolgt, und je länger Sie mit dem Copilot arbeiten, desto mehr passt er sich auf Sie ein, und umso besser werden die Ergebnisse.
Nehmen Sie nicht die erste Version, sondern fragen Sie nach
Dann noch einmal die Frage: Wie könnte ich den Artikel optimieren? Also nicht die erste Version nehmen, sondern noch einmal nachfragen. Dann liefert er entsprechende Ideen. Wenn ich das Ganze habe, habe ich gesagt: „Erstelle mir auf Basis dieses Chats eine Beschreibung für einen Agenten, der Blogartikel für Kleinunternehmen schreibt.“
Das ist genau die Idee: Wenn Sie einen guten Prompt und einen guten Chatverlauf haben, wo Sie die Inhalte erarbeitet haben, ist es so, wie wenn ein Azubi etwas richtig gut gemacht hat und Sie sagen: „Das merkst du dir jetzt und machst es bitte immer wieder so.“ Über die benutzerdefinierten Einstellungen, die Custom Instructions und das Speichern von Inhalten kann man das unterstützen. Aber jetzt kann ich eben sagen: „Mach mir eine Beschreibung für einen Agenten.“
Reverse Engineering für perfekte Agents
Jetzt hat er mir hier eine Beschreibung gemacht und die ist richtig klasse. Da wäre ich jetzt ehrlich gesagt nicht draufgekommen und dann hat er mich noch mal gefragt: „Willst du, dass ich das jetzt mal schreibe oder willst du hier eben eine Agentendefinition?“ Habe ich mir eine komplette Agentendefinition geben lassen und diese Agentendefinition, die ich mir hier noch mal überarbeiten habe lassen, die habe ich jetzt in einen Agenten eingebaut. Das heißt, hier habe ich gesagt: „Erstelle mir einen Agenten.“ Und diese Agenten können Sie unter „neuer Agent erstellen“, auch übrigens in der Version, die bei Microsoft 365 mit drin ist, erstellen. Und dann habe ich das Ganze hier in „Beschreiben“ eingegeben. Da wir hier eine Begrenzung von 2000 Zeichen haben, muss man das manchmal auf zweimal machen. Und dann macht er mir daraus eine Konfiguration, wo er Dinge reingeschrieben hat, die ich dort hier erarbeitet habe, die hätte ich mit Sicherheit nicht so gut geprüft. Wichtig ist dann hier auch immer noch beim Thema „Agenten“: Alle Webseiten, also das Internet, im Regelfall bitte abklemmen und auch zu sagen, er soll bitte nur die gegebenen Quellen nutzen und nichts anderes. Also weniger ist erfahrungsgemäß mehr. Aber Codeinterpreter, dass er analysieren kann, arbeiten soll, das bitte ja, Bilder gerne auch und dann macht er mir hier entsprechende Vorschläge.
Ja, das haben wir hier so eingestellt, und wenn ich dann gucke, dann haben wir einfach mal gesagt: „Mach mir denn daraus mal einen Artikel.“ Und das war dann das Ergebnis, wo wir hier gesagt haben, mit diesem Bot haben wir gesagt: „Schreibe mir einen Artikel über Aseptoman Pro.“ Und das ist eben ein spezielles Produkt dieses Unternehmens, und da gibt es auch eine Webseite dazu. Und dann kommt hier wunderbar in einem Ding, kommt hier dazu ein wunderbarer Artikel mit einer Meta-Beschreibung und auch mit FAQs, weil das haben wir eben auch mitgegeben. Die KI sind ja immer so, dass die Frage- und Antworten liegen. Also, wenn Sie sich einen Bot bauen für das Thema, also einen Agenten bauen für das Thema „Blogbeiträge“, ist es eine gute Idee, zu sagen, am Ende bitte immer fünf Q&As mit reinpacken oder zehn. Und da war der Kunde sehr, sehr begeistert, wie gut das Ganze funktioniert hat. Also die Idee ist, gerade wenn Sie Agents bauen, zu sagen, Sie haben irgendwo super Ergebnisse, Sie haben super Prompts, und dann sagen Sie: „Mensch, mach doch mal Reverse Engineering, baue mir daraus eine Anweisung für einen Bot, baue mir daraus einen perfekten Prompt.“
Auch das kann ich am Ende einer langen Diskussion sagen: „So, jetzt sind wir zu dem Ergebnis gekommen. Gib mir jetzt bitte mal einen Prompt, wie ich eben auch direkt zu diesem Ergebnis kommen würde.“ Das heißt nicht zu sagen: „Ich habe einen Prompt, ich gucke mal, was rauskommt“, sondern „Ich habe ein Ergebnis, und das kann auch beispielsweise ein echtes Ergebnis sein.“ Also zu sagen: „Hier lade ich einen Artikel hoch und sage: „Okay, beschreib mal diesen Artikel, wie du den prompten würdest.“ Und dann ist es so, dann kriegt man eben „Prompt dazu“. Und das finde ich immer sehr, sehr spannend, wenn man Ergebnisse rückwärts prompten lässt, dann kommt was ganz anderes raus, als was normalerweise wir als Mensch hätten prompten wollen. Das hat man übrigens auch wunderbar beim Thema Bilder. Und beim Thema Bilder gucken wir uns natürlich mein aktuelles Lieblingsmodell an, und zwar Google „Nano-Banana“. Das haben Sie im Bereich bei Google Gemini mit drin. Und das, was die meisten machen, die gehen in einen neuen Chat rein und gehen erst mal auf die Banane, ein Bild zu erzeugen. Das machen sie nicht, sondern erst mal die Banane raus. Wichtig, dass man hier Thinking mit drei Pros hat.
So erstellen Sie perfekte Prompts für die Bildgenerierung
Und jetzt macht man Folgendes: Jetzt sagt man: „Beschreibe das Bild als Basis für einen Nano-Banana-Pro-Prompt.“ Also, ich habe hier ein Bild meiner Frau von der Veranstaltung hochgeladen und habe gesagt: „Beschreib mir das.“ So, und jetzt kommt eine detaillierte Bildanalyse, also sozusagen hier eine Frau, welche Pose, welche Kleidung, welcher Hintergrund, zentrale Elemente, Umgebungsdetails, Stilbeleuchtung und so weiter. Und jetzt kommt ein Promptvorschlag für Bildgeneratoren. Das heißt, er zeigt mir einmal hier eine Bildanalyse, er gibt mir eben einen Prompts-Vorschlag, Vorschlag eins in Englisch, weil er weiß, dass die Modelle in Englisch eben besser arbeiten, er gibt mir einen Negativprompt, er gibt mir hier sogar noch Hinweise, was ich beachten sollte, dass ich beispielsweise das Thema mit Texten noch mal gucken sollte, dass das Gesicht relativ klein auf dem Foto ist. Also da könnte es Schwierigkeiten geben. Und jetzt habe ich gesagt: „Erstelle ein ähnliches Bild mit der gleichen Frau vom hochgeladenen Bild in einem roten Kleid im Format 16:9 quer mit dem Prompt ‚Mission 1′.“ Wenn ich jetzt mal gucke, das war das Originalbild von meiner Frau, das ist das Kleid in Rot, und das schaut ziemlich gut aus. Also das heißt, hier die Idee: immer ein möglichst ähnliches Bild hochladen.
Also auch wenn Sie eine Bildidee haben, vielleicht in Ihrem Laden mit zwei Kunden beispielsweise, Sie sagen: „Ich will aber da nicht selber drauf sein“, dann machen Sie ein Foto von zwei Mitarbeitern und dann ersetzen Sie die zwei durch eine andere Person, beispielsweise. Also bis zu 14 Objekte können Sie auch zusammenfügen in diesen Nano-Banana-Jobs, die zusammenzupacken. Jetzt habe ich gesagt: „Okay, stell diesen mal in ähnlicher Pose daneben.“ Das ist wirklich nur so ein Oberkörperbild aus der Bahn, so ein Selfie. Da sind keine Arme dabei, da sind keine Beine dabei. Also das ist relativ knapp und habe gesagt: „Geld an daneben.“ Und er ist 10 Zentimeter größer. Das heißt, ich gebe ihm die Information. Das ist eben auch etwas: Woher weiß die Kiste, wenn man so ein Bild hat, ob der Mann jetzt 2,10 Meter lang ist oder 1,50 Meter lang ist. Weiß man nicht. Also sollte man es demjenigen entsprechend mitgeben. So, er ist 10 Zentimeter größer und dann sage ich eben: „Da hat er mich daneben gepackt.“ Das sind jetzt keine und keine Hose aus meinem Kleiderschrank. Eine U habe ich auch, eine andere, aber die Information hatte ich ja nicht und das hat er gut ergänzt.
Da das letzte Foto im Hochformat war, hat er es jetzt ins Hochformat reingepackt. Kann man aber gleich ändern, indem ich sage: „Bitte im 16:9-Querformat.“ Jetzt will ich diesen Tisch, den er da hinzugefügt hat, weg haben und die Stange. Jetzt habe ich gesagt: „Okay, pack mal den Tisch weg.“ Das hat er gemacht. Die Stange, da muss man vielleicht noch mal im zweiten Step rangehen. Also Sie kriegen eine Idee davon, was dort die Logik dahinter ist. Das heißt, dass man beim Thema Bilder fast noch wichtiger erst mal ein Foto hochlädt, was eben so ist, dass man sagt: „So stelle ich mir das vor und so soll das aussehen.“ Das soll relativ nahe dran sein. Man kann hier beim Thema Bild-Prompt auch noch mal sagen: „Wie kann ich den optimieren?“ Man kann auch noch mal sagen: „Guck mal, ob du die Kamera-Einstellungen von diesem Bild ungefähr nachbilden kannst und die Kamera.“ Oder man sagt, wenn Sie wissen, das wurde mit dem iPhone irgendwas fotografiert, zu sagen: „Okay, wurde damit fotografiert?“ Also das heißt, hier darüber erst mal sich den Prompt geben zu lassen und dann diesen Prompt wieder anzuwenden. Und das eben entweder mit Ergebnissen, die Sie schon mit KI erzeugt haben, Ergebnissen, die Sie mit DALL-E erzeugt haben.
Copilot liefert signifikant brauchbarere Ergebnisse im Vergleich zu ChatGPT
Sie drehen es praktisch um. Das Gleiche eben, wenn Sie auch vielleicht mitten in Prompts drin sind, dann einfach auch mal einen anderen Prompt aufmachen und sagen: „Hier habe ich ein Dokument. Guck mal, wie wäre dort ein guter Prompt?“ Und dann kann man es auch wieder rüberkopieren, wenn vielleicht der Chat etwas knapp wird langsam oder wenn man sich den in Anführungsstrichen nicht versauen will durch Nebenaktionen in dem Bereich. Also deswegen hier immer: Reverse Engineering macht auch beim Thema künstliche Intelligenz total viel Sinn. Ich hoffe, das war wieder ein wertvoller Impuls, denn Sie wissen ja, ich habe immer das Motto „Erst Hirn einschalten, dann Technik und dann Technik einfach nutzen“. Und ich höre immer oft: „Ja, eine ChatGPT ist doch viel besser als Copilot.“ Also wenn ich Copilot richtig briefe, wenn ich dort vernünftig dann auch in der bezahlten Version sogar auf Firmendaten drauf zugreife, dann sind die Ergebnisse im Business-Kontext signifikant brauchbarer als das, was ich bei ChatGPT rausbekomme. Und die Daten liegen auch eben bei Microsoft in Deutschland im eigenen Mandanten. Die KI-Verarbeitung läuft aktuell noch in Irland, aber auch da sind wir in der Europäischen Union, und die Daten sind in Frankfurt.
Firmen wollen und müssen Schatten-KI vermeiden
Also wenn jemand sagt „Outlook und so haben wir alles freigeschaltet, aber wir haben eben nicht den Copilot freigeschaltet, auch in der mitgelieferten Version“, dann sage ich, dann müssten sie auch zur Konsequenz sein und SharePoint und Teams abklemmen, weil der Datenspeicherort ist der gleiche. Also da hatte ich jetzt auch Freitags für eine Diskussion mit dem Kunden, der auch gesagt hat: „Ja, eigentlich haben Sie recht, wenn wir es abklemmen, was machen die Mitarbeiter dann?“ Es gibt ja Studien, die zeigen, dass 80% der Mitarbeiter mittlerweile KI nutzen und nur 40% der Unternehmen KI zur Verfügung stellen. Nennt sich „Schatten-IT“ und „Schatten-KI“, und das wollen Sie definitiv nicht haben. Also wenn Sie Microsoft 365 haben, auf alle Fälle den Microsoft Copilot freischalten und dann eben sensibilisieren und zeigen, wie man damit so gut promptet, dass man überhaupt keine Lust mehr hat, auf das Thema ChatGPT zu gehen. Vielleicht noch ein letzter Impuls dazu: Wenn Sie Agents erstellen, die dann auch mit SharePoint-Bibliotheken sich mit Teams verknüpfen beispielsweise, dafür brauchen Sie die bezahlte Lizenz. Die gute Nachricht ist aber: Die braucht nur derjenige, der sie erstellt. Das heißt, am kleinen Team können Sie diese bezahlten Lizenzen geben und können dann diese Agents auch über Teams, über SharePoint, über Links dort verteilen.
Fazit
Und die Mitarbeiter brauchen dafür keine dieser bezahlten Copilot-Lizenzen, die noch mal 30 Euro im Monat kosten. Mir allerdings spart dieser Copilot, wenn man ihn vernünftig nutzt, deutlich mehr als 30 Euro an Arbeitszeit. Vor dem Hintergrund ist es eine Investition, über die man sinnvollerweise vielleicht mal nachdenken sollte. In diesem Sinne: Erst Hirn in der Entscheidung, dann Technik.
Ihr Thorsten Jekel.
