Heute Morgen habe ich eben mal vier Dinge erledigt:
- Ein Drehbuch inkl. Drehplan und Location Scouting produziert,
- eine Excel-Tabelle mit Teilnehmerwünschen in eine Agenda für eine After Effects Schulung umgewandelt,
- aus einer dreistündigen Aufzeichnung eines Online-Trainings eine Inhaltsbeschreibung der wichtigsten Themen inkl. Timecodenachweisen zusammengefasst und
- diesen Blog-Artikel geschrieben.
Allein für den ersten Punkt habe ich in der Vergangenheit mindestens einen halben Arbeitstag benötigt. An Punkt drei hätte ich mich im Leben nicht dran gemacht und meinen Blog habe ich in der letzten Zeit sowieso vollkommen vernachlässigt.
Klar, das geht in so einem kurzen Zeitraum nur mit generativer KI. Lief das alles perfekt? Naja, schon ziemlich gut. Und zwischendurch brauchte die KI auch einen kleinen Tritt in ihren künstlichen Arsch… aber am Ende hat sie mir dann sogar verraten, was ich nächstes mal bestellen sollte, um das gewünschte Ergebnis schneller zu bekommen. Und jetzt eines nach dem anderen!
Video-Preproduktion mit dem Microsoft Copilot
Ich nutze für meine Premiere Pro Schulungen schon seit einer ganzen Zeit dasselbe Beispielvideo. Irgendwie fehlte mir immer die Idee, was ich Neues produzieren sollte. Also mal schauen, was Microsoft Copilot mir vorschlägt. Meine erste Frage:
„Ich unterrichte Premiere Pro und benötige dafür einen ca. 2 minütigen Film, den die Teilnehmenden in einem Seminar nachschneiden können. Für diesen Film benötige ich erstmal Ideen zu interessanten Themen.“
Und schon spuckt der Copilot acht Ideen aus. Beim durchlesen kommt mir die Idee zwei der Vorschläge zu kombinieren: Also ein Video, bei dem es um Sport und Sponsoring geht. Das passt gut zusammen und verspricht spannende Bilder. Und da ich viele Marketing-Abteilungen unterrichte, können die sich mit dem Thema sicher gut identifizieren. Ich frage den Copiloten, was er von der Kombination hält und wie das aussehen könnte. Die KI ist von meiner Idee hellauf begeistert und legt los: ich erhalte einen Filmtitel, eine Kurzbeschreibung von drei Akten, ein paar Dinge, an die ich denken sollte und sogar nette Hinweise, was die Teilnehmenden an dem Werkstück lernen könnten. So viel Motivation hätte ich der KI garnicht zugetraut.
Ich habe das Gefühl, sie kann es gar nicht abwarten mir dazu ein Drehbuch zu präsentieren und ich habe kaum die Enter-Taste gedrückt, da erscheinen schon die Dialoge auf meinem Bildschirm.
Nachdem ich das Drehbuch gelesen habe frage ich noch wie viele einzelne Aufnahmen für einen Film dieser Art notwendig sind, wie lange ich die Drehzeit kalkulieren sollte und welche Kosten mir entstehen. Ok, jetzt bekomme ich erstmal ein paar Konjunktive und allgemeine Hinweise. Klingt ungefähr so wie ich selbst, wenn der Kunde gleich im Erstgespräch für eine Videoproduktion schon eine Kosteneinschätzung haben will… schon klar, wir müssen noch ein paar Details klären.
Und während ich so über das Drehbuch nachdenke, merke ich, dass mir da noch ein bisschen Schwung fehlt. Es ist mir nicht konkret genug. Liegt vielleicht daran, dass wir noch keine Sportart definiert haben. Also lieber Copilot: schlage mir doch mal ein paar Trendsportarten vor. Von einigen Sportarten habe ich noch nie etwas gehört. Aber Trailrunning bringt mich auf die Idee etwas mit Parkour zu machen.
„Kannst Du mal eben das Drehbuch umschreiben und das Thema Parkour einarbeiten?“
Natürlich… gerne… ich schaffe es nicht mal mehr mir einen Kaffee zu holen, da habe ich schon das neue Drehbuch. Auf meine Frage wie lange es braucht, um alle Dialoge zu sprechen antwortet mir der Copilot, wie lange der Film insgesamt dauern wird und nennt gleich die Dauer der einzelnen Szenen dazu. Sehr praktisch.
Jetzt wäre es gut, wenn ich die Szenen hier in Kiel drehen könnte. Ich lasse mir vom Copiloten ein paar Drehorte in Kiel recherchieren und für die Darsteller eine Liste von Parkour-Vereinen ausgeben. Netterweise schreibt der Copilot sowieso zu jeder Antwort die passenden Links dazu.
Das waren jetzt die ersten 20 Minuten des Tages. Und ich habe das Gefühl, dass mein Vormittag eigentlich rum sein müsste, wenn ich auf das Ergebnis schaue. Natürlich würde ich im Drehbuch noch ein paar Dialoge umformulieren und vielleicht auch inhaltlich ein paar Dinge ändern. Aber dafür, dass ich vor 20 Minuten noch gar keine eine Idee hatte, bin ich schon ganz schön weit gekommen.
Ich habe kein spezielles Abo für Copilot abgeschlossen, aber mein Microsoft 365 Business Account, erlaubt es mir Konversationen mit bis zu 30 aufeinanderfolgenden Fragen zu stellen. Benutzt man die kostenlose Version muss man nach fünf Fragen eine neue Konversation starten und das ist für komplexe Themen, die aufeinander aufbauen nicht brauchbar. Das kann man sich ungefähr so vorstellen, wie ein Gesprächspartner der sich nach fünf Fragen an nichts mehr erinnern kann. Für diese Konversation habe ich insgesamt 9 Anfragen gestellt.
Seminarvorbereitung mit ChatGPT
Jetzt erstmal eine Kaffeepause, denn es gibt noch einiges zu tun heute Morgen. ChatGPT ist gerade in der Version 4o herausgekommen. Das o steht für „Omni“ und meine Erwartungshaltung ist entsprechend groß, daher habe ich mein Abo für 22,99 Euro pro Monat wieder aktiviert. Ein kostenloser Account basiert auf ChatGTP 3.5 und da kann man weder Dokumente hochladen noch versteht die KI sehr komplexe Anfragen besonders gut.
Für meine nächstes After Effects online Seminar haben mir die Teilnehmenden eine Excel-Tabelle mit ihren Themenwünschen geschickt. Ich muss aus diesen Wünschen und meinem Schulungskonzept eine Agenda zusammenstricken.
Also lade ich die Excel-Tabelle hoch, kopiere meine übliche Agenda für ein After Effects Grundlagentraining in die Eingabemaske und bitte ChatGPT aus beiden Elementen eine zweitägige Agenda zusammenzustellen. Hä, was… schon fertig. Krass.
Wenn das so schnell geht, hätte ich noch gerne eine Liste der Wünsche nach Teilnehmenden sortiert, damit ich in der Vorstellungsrunde individueller auf die Wünsche eingehen kann. Diese Information ist in der Excel-Tabelle vom Kunden irgendwie unübersichtlich gewesen. Auch die zweite Aufgabe erledigt ChatGPT mit Bravour und ich habe die Vorbereitung meiner Schulung in gerade mal vier Minuten abgeschlossen. Dokumente scheint ChatGPT also sehr gut zu verstehen. Mal sehen, was ich heute noch so schaffe.
Zusammenfassung eines dreistündigen Videotrainings mit ChatGPT
Ich schaue mal auf die Uhr… der Vormittag ist noch jung und für die 22,99 Euro soll ChatGPT noch ein bisschen arbeiten. Also möchte ich mal einen Versuch wagen: bei meinen online Seminaren bekommen die Teilnehmenden immer eine Aufzeichnung. So ein Video ist nach einem halben Schulungstag schnell zwei bis drei Stunden lang. Die Zeiten in denen die Teilnehmenden die Praxisübungen durchführen, zeichne ich in der Regel nicht auf.
Also importiere ich die Aufzeichnung in Premiere Pro und lasse mir über die integrierte Texttranskription eine Textdatei ausgeben. Premiere Pro ergänzt zu den einzelnen Absätzen automatisch die Zeiten aus dem Video. Die Textdatei lade ich in ChatGPT und bitte die KI mir daraus eine chronologische Zusammenfassung der wichtigsten Themen inkl. Timecode-Verweise für das Video zu schreiben. Das würde es den Teilnehmenden sehr erleichtern ein bestimmtes Thema in der Aufzeichnung zu finden!
Es klappt nicht auf Anhieb – aber wir finden durch etwas Hartnäckigkeit zueinander
Das erste Ergebnis ist ernüchternd. Die Zeiten stimmen nicht und die Zusammenfassung geht nur bis zur ersten Stunde. Ich bohre nach… mein Drängen führt dazu, dass die KI halluziniert und sich ein paar Themen ausdenkt, die ich zwar generell in After Effects unterrichte, die aber in diesem Video überhaupt nicht vorgekommen sind. Wahrscheinlich hätte ich lieber ein neues Thema anfangen sollen. Die KI erinnert sich wohl noch an die vorangehende Agenda und vermischt jetzt die Themen. Darauf angesprochen wird ChatGPT kurz rot und entschuldigt sich.
Ich brauche noch ein paar Überzeugungsversuche und dann bekomme ich endlich das gewünschte Ergebnis: Eine 2-seitige Themenzusammenfassung mit einer kurzen Beschreibung und den dazugehörigen Zeitangaben. Ich frage ChatGPT, was ich beim nächsten mal prompten soll, damit ich dieses Ergebnis beim ersten Versuch erhalte. Die KI wirkt erfreut, dass ich lernen möchte, wie sie in Zukunft bedient werden will und gibt mir eine Anleitung für zukünftige Verständigung:
Ich habe ein Transkript aus einer Schulung zu [Thema]. Bitte erstelle eine vollständige, chronologisch sortierte Zusammenfassung der wichtigsten Themen aus diesem Transkript. Die Zusammenfassung sollte Startzeiten in Stunde:Minute:Sekunde angeben, um die jeweiligen Stellen im dazugehörigen Video zu finden. Achte darauf, alle wichtigen Abschnitte zu berücksichtigen und nichts auszulassen.
Beispiel:
Thema 1
Zeit: 00:00:02
Inhalt: [Kurze Beschreibung des Themas]
Thema 2
Zeit: 00:05:24
Inhalt: [Kurze Beschreibung des Themas]
Ich habe es mit dem neuen Prompt bisher noch nicht probiert, aber fürs Erste sind wir Freunde. Es hat mich 20 Minuten Zeit gekostet, um aus ChatGPT die richtige Antwort herauszubekommen. Nicht unterschlagen möchte ich auch die Transkriptionsdauer von knapp 25 Minuten in Premiere Pro.
Der Blogartikel zum Berufsalltag mit generativer KI und was ich mit dem freien Nachmittag gemacht habe
Prima, jetzt bleibt noch Zeit, um einen Blog-Artikel über meine Erfahrungen mit generativer KI zu schreiben. Und ja, das habe ich überraschenderweise selbst geschrieben. Keine KI. Ich schwöre. Irgendwie muss man ja seinen Vormittag rumkriegen. Zukünftige Artikel werde ich garantiert mit KI-Unterstützung herstellen. Die Zeitersparnis ist einfach zu hoch. Ich gebe zu, dass ich versucht war, mir von DeepL Write einen Vorschlag zur Verbesserung des Schreibstils ausgeben zu lassen. Dann wären keine Rechtschreibfehler mehr im Text und alles wäre KI mäßig glatt gebügelt.
Für den Freizeit-Part wollte ich die neuen Audio-Dialogfunktionen von ChatGPT 4o ausprobieren. Ich wähle Juniper als Dialogpartner und erzähle ihm, dass ich Anfang des Jahres nach Kiel gezogen bin und dass ich heute Nachmittag frei habe. Ich möchte von ihm wissen, was man an einem sonnigen Tag in Kiel machen könnte. Juniper freut sich hörbar, dass ich nicht arbeiten muss und berichtet enthusiastisch von den vielen Möglichkeiten, die die Landeshauptstadt des schönsten Bundeslandes der Republik zu bieten hat.
Baden im Seebad in Düsternbrook, ist vielleicht noch etwas frisch, aber ein Picknick im Schrevenpark oder eine Fahrradtour zum Friedrichsorter Leuchtturm klingen nach Erholung. Natürlich kommt nachmittags alles anders, weil mein kleines Beutekind lieber Rollschuhlaufen möchte und wir den Nachmittag daher in der Turnhalle verbringen. Aber das ist das echte Leben. Wie schön, das KI noch nicht alles weiß… noch nicht. Aber sie lernt… rasant schnell.
Das Titelbild habe ich mit Adobe Firefly und Photoshop generiert
Das Titelbild für diesen Artikel habe ich dann einen Tag später mit Generativer KI erstellt. In Firefly Image Model 3 habe ich mit einem ersten Satz angefangen und den Prompt dann Schritt für Schritt erweitert. Als Firefly nach einigen Versuchen und Erweiterungen die richtige Bildaufteilung vorgeschlagen hat, habe ich das generierte Bild als Struktur-Referenz verwendet für weitere Ergänzungen benutzt. Damit war sichergestellt, dass die Position der Personen und der Bildausschnitt immer sehr ähnlich blieb. Eine sehr praktische Funktion, mit der man sich hervorragend zum Ziel bewegen kann.
Schlussendlich habe ich immer wieder Zwischenergebnisse in meine Creative Cloud Bibliothek gespeichert und daraus dann in Photoshop das finale Ergebnis zusammengestellt. Bei der Erweiterung des Bildausschnitts habe ich die Generative Erweiterung in Photoshop genutzt.
Hier der Prompt, den ich in Adobe Firefly zusammen mit einer Struktur-Referenz verwendet habe:
Ein Roboter und ein Mann stehen nebeneinander am Hafen und blicken auf die Ostsee. Die beiden sind identisch groß und von hinten zu sehen. Der Mann steht auf der rechten Seite und legt dem Roboter einen Arm auf die Schulter. Der Mann trägt ein türkis-blaues T-Shirt, eine Jeans und hat eine Dreadlock Frisur. Der schlanke, futuristische Roboter im Cyberpunk Stil hat einen schwarzen Torso mit strahlend weiß lackierten Chromverkleidungen.
Stile: Hyperrealistisch, Digitale Kunst, Cyber-Matrix, Kinematisch, Biolumineszierend, Bokeh-Effekt
Farbe und Ton: Goldene Stunde
Hier der Link zu dem generierten Bild in Firefly. Für mich ist es eine gute Methode generative KI zu verwenden und die Ergebnisse anschließend so zu verfeinern, wie ich es haben möchte. Durch die Verwendung von KI-Tools gewinne ich mehr Zeit für andere Aufgaben oder sogar für Freizeit. Es bleibt also spannend, was da im Laufe dieses und der nächsten Jahre auf uns zurollt. Persönlich halte ich es für eine der größeren Revolutionen – die Frage ist in welche Richtung.
Wer Lust hat sich mit mir über das Thema generative KI auszutauschen ist herzlich willkommen – gerne in den Kommentaren aber am liebsten bei einer Tasse Espresso in einem der schönen Cafés in der Innenstadt oder an der Kielline mit Blick über den Hafen.