🧠Claude 3.5 Sonnet überrascht im Vergleich zu ChatGPT o1-preview!






🔍Nun habe ich auch noch das Modell Claude 3.5 Sonnet von Anthropic mit der anspruchsvollen Eidg. Höheren Fachprüfung für Expert*Innen in Rechnungslegung und Controlling 2021 konfrontiert. 🧠

Und was soll ich sagen? Die Ergebnisse waren überraschend und beeindruckend!

✅ Plan-Erfolgsrechnung: Nach ein paar kleinen Nachbesserungen bei den Fremdkapitalzinsen lieferte Claude 3.5 eine fehlerfreie Erfolgsrechnung. Mit 2-3 Rückfragen und Korrekturen konnte ich die ER vollständig und korrekt (!) erstellen – was ich so ehrlich nicht erwartet hätte!

💼 Plan-Bilanz: Die meisten Positionen waren auf Anhieb korrekt. Bei den Bankkrediten jedoch tat sich Claude 3.5, wie auch ChatGPT o1-preview, schwer. Trotz intensiven Austauschs mit Claude konnte ich bei Claude die richtige Lösung am Ende nicht erreichen. War aber nahe dran.

💧 Plan-Mittelflussrechnung: Auch hier gab es richtig solide Ansätze. Aber die Veränderung der liquiden Mittel nach Amortisation der Bankkredite liess sich auch nach mehreren Anläufen nicht korrigieren. Doch die Fortschritte und das Potenzial von Claude sind nicht zu übersehen!

➡️ Fazit: Claude 3.5 Sonnet hat mich echt überrascht. Ich musste noch sehr viel verbessern, aber Claude hat die Punkte doch schnell verstanden und korrigiert. Das Modell kommt näher an ChatGPT o1-preview heran, als ich erwartet hatte und hat nun definitiv meine volle Aufmerksamkeit! 🤯


Herzlichst, Roman Kalberer

🧠Claude 3.5 Sonnet überrascht im Vergleich zu ChatGPT o1-preview!
Roman Kalberer 24. November 2024
Diesen Beitrag teilen
Stichwörter
Archivieren
🔍 ChatGPT o1-preview vs Gemini 1.5 Pro 002 bei Fachprüfungsaufgaben! 🔍