Evaluation Bundesbot

proof of concept für eine automatische evaluierung eines itzbund chatbots mithilfe eines sprachmodells

Evaluation Bundesbot

Letzte Aktualisierung

Dieses Projekt liefert Ideen für eine automatische Auswertung einer Instanz des ITZBund-Chatbots (auch Bundesbot genannt, siehe z.B. https://www.itzbund.de/DE/itloesungen/standardloesungen/chatbots/chatbots.html). Es sollte als Proof-of-Concept betrachtet werden und eine Vorlage für andere liefern, die mit einem ähnlichen Problem betraut sind. In diesem Projekt verwenden wir ein großes Sprachmodell (LLM), um Fragen zu generieren, die an den Chatbot gesendet werden könnten. Die neu generierten Fragen umfassen Variationen der vordefinierten Fragen mit oder ohne Tippfehler, Übersetzungen und neue Fragen zu einem bestimmten Thema. Die Antworten werden über die API des Chatbot abgerufen und mit den vordefinierte Antworten verglichen. Zusätzlich wird das LLM verwendet, um anhand einer Punktzahl zwischen 1 und 3 zu bewertenm, ob die Antwort eine gültige Reaktion auf die Frage ist.

Absender & Kontakt

  • UBA KI-Lab

Features

  • Parsen des JSON-Exports des Bundesbot
  • Generieren neuer Fragen mit Hilfe eines Sprachmodells
  • Auswertung der Chatbot-Antwort

Software-Check

Erstellt am

17.04.24

Letztes Update:

09.01.25

Status

concept

Platform

linux

Softwareversion

0.1

Lizenz

MIT License

Was ist openCode?

openCode ist die zentrale Plattform für eine unabhängige und selbstbestimmte Digitalisierung der deutschen Verwaltung. Jetzt die digitale Zukunft Deutschlands aktiv mitgestalten.

Mehr erfahren