• Zum Inhalt springen (Accesskey 1)
  • Zur Suche springen (Accesskey 7)
FWF — Österreichischer Wissenschaftsfonds
  • Zur Übersichtsseite Entdecken

    • Forschungsradar
      • Historisches Forschungsradar 1974–1994
    • Entdeckungen
      • Emmanuelle Charpentier
      • Adrian Constantin
      • Monika Henzinger
      • Ferenc Krausz
      • Wolfgang Lutz
      • Walter Pohl
      • Christa Schleper
      • Elly Tanaka
      • Anton Zeilinger
    • Impact Stories
      • Verena Gassner
      • Wolfgang Lechner
      • Birgit Mitter
      • Oliver Spadiut
      • Georg Winter
    • scilog-Magazin
    • Austrian Science Awards
      • FWF-Wittgenstein-Preise
      • FWF-ASTRA-Preise
      • FWF-START-Preise
      • Auszeichnungsfeier
    • excellent=austria
      • Clusters of Excellence
      • Emerging Fields
    • Im Fokus
      • 40 Jahre Erwin-Schrödinger-Programm
      • Quantum Austria
      • Spezialforschungsbereiche
    • Dialog und Diskussion
      • think.beyond Summit
      • Am Puls
      • Was die Welt zusammenhält
      • FWF Women’s Circle
      • Science Lectures
    • Wissenstransfer-Events
    • E-Book Library
  • Zur Übersichtsseite Fördern

    • Förderportfolio
      • excellent=austria
        • Clusters of Excellence
        • Emerging Fields
      • Projekte
        • Einzelprojekte
        • Einzelprojekte International
        • Klinische Forschung
        • 1000 Ideen
        • Entwicklung und Erschließung der Künste
        • FWF-Wittgenstein-Preis
      • Karrieren
        • ESPRIT
        • FWF-ASTRA-Preise
        • Erwin Schrödinger
        • doc.funds
        • doc.funds.connect
      • Kooperationen
        • Spezialforschungsgruppen
        • Spezialforschungsbereiche
        • Forschungsgruppen
        • International – Multilaterale Initiativen
        • #ConnectingMinds
      • Kommunikation
        • Top Citizen Science
        • Wissenschaftskommunikation
        • Buchpublikationen
        • Digitale Publikationen
        • Open-Access-Pauschale
      • Themenförderungen
        • AI Mission Austria
        • Belmont Forum
        • ERA-NET HERA
        • ERA-NET NORFACE
        • ERA-NET QuantERA
        • Ersatzmethoden für Tierversuche
        • Europäische Partnerschaft BE READY
        • Europäische Partnerschaft Biodiversa+
        • Europäische Partnerschaft BrainHealth
        • Europäische Partnerschaft ERA4Health
        • Europäische Partnerschaft ERDERA
        • Europäische Partnerschaft EUPAHW
        • Europäische Partnerschaft FutureFoodS
        • Europäische Partnerschaft OHAMR
        • Europäische Partnerschaft PerMed
        • Europäische Partnerschaft Water4All
        • Gottfried-und-Vera-Weiss-Preis
        • LUKE – Ukraine
        • netidee SCIENCE
        • Projekte der Herzfelder-Stiftung
        • Quantum Austria
        • Rückenwind-Förderbonus
        • WE&ME Award
        • Zero Emissions Award
      • Länderkooperationen
        • Belgien/Flandern
        • Deutschland
        • Frankreich
        • Italien/Südtirol
        • Japan
        • Korea
        • Luxemburg
        • Polen
        • Schweiz
        • Slowenien
        • Taiwan
        • Tirol-Südtirol-Trentino
        • Tschechien
        • Ungarn
    • Schritt für Schritt
      • Förderung finden
      • Antrag einreichen
      • Internationales Peer-Review
      • Förderentscheidung
      • Projekt durchführen
      • Projekt beenden
      • Weitere Informationen
        • Integrität und Ethik
        • Inklusion
        • Antragstellung aus dem Ausland
        • Personalkosten
        • PROFI
        • Projektendberichte
        • Projektendberichtsumfrage
    • FAQ
      • Projektphase PROFI
      • Projektphase Ad personam
      • Auslaufende Programme
        • Elise Richter und Elise Richter PEEK
        • FWF-START-Preise
  • Zur Übersichtsseite Über uns

    • Leitbild
    • FWF-Film
    • Werte
    • Zahlen und Daten
    • Jahresbericht
    • Aufgaben und Aktivitäten
      • Forschungsförderung
        • Matching-Funds-Förderungen
      • Internationale Kooperationen
      • Studien und Publikationen
      • Chancengleichheit und Diversität
        • Ziele und Prinzipien
        • Maßnahmen
        • Bias-Sensibilisierung in der Begutachtung
        • Begriffe und Definitionen
        • Karriere in der Spitzenforschung
      • Open Science
        • Open-Access-Policy
          • Open-Access-Policy für begutachtete Publikationen
          • Open-Access-Policy für begutachtete Buchpublikationen
          • Open-Access-Policy für Forschungsdaten
        • Forschungsdatenmanagement
        • Citizen Science
        • Open-Science-Infrastrukturen
        • Open-Science-Förderung
      • Evaluierungen und Qualitätssicherung
      • Wissenschaftliche Integrität
      • Wissenschaftskommunikation
      • Philanthropie
      • Nachhaltigkeit
    • Geschichte
    • Gesetzliche Grundlagen
    • Organisation
      • Gremien
        • Präsidium
        • Aufsichtsrat
        • Delegiertenversammlung
        • Kuratorium
        • Jurys
      • Geschäftsstelle
    • Arbeiten im FWF
  • Zur Übersichtsseite Aktuelles

    • News
    • Presse
      • Logos
    • Eventkalender
      • Veranstaltung eintragen
      • FWF-Infoveranstaltungen
    • Jobbörse
      • Job eintragen
    • Newsletter
  • Entdecken, 
    worauf es
    ankommt.

    FWF-Newsletter Presse-Newsletter Kalender-Newsletter Job-Newsletter scilog-Newsletter

    SOCIAL MEDIA

    • LinkedIn, externe URL, öffnet sich in einem neuen Fenster
    • , externe URL, öffnet sich in einem neuen Fenster
    • Facebook, externe URL, öffnet sich in einem neuen Fenster
    • Instagram, externe URL, öffnet sich in einem neuen Fenster
    • YouTube, externe URL, öffnet sich in einem neuen Fenster

    SCILOG

    • Scilog — Das Wissenschaftsmagazin des Österreichischen Wissenschaftsfonds (FWF)
  • elane-Login, externe URL, öffnet sich in einem neuen Fenster
  • Scilog externe URL, öffnet sich in einem neuen Fenster
  • en Switch to English

  

Knowledge Delta-basierte kontinuierliche Bewertung

Knowledge Delta based improvement and continuous evaluation

Florina Mihaela Piroi (ORCID: 0000-0001-7584-6439)
  • Grant-DOI 10.55776/I4471
  • Förderprogramm Einzelprojekte International
  • Status beendet
  • Projektbeginn 01.04.2021
  • Projektende 31.03.2025
  • Bewilligungssumme 399.887 €
  • Projekt-Website

Bilaterale Ausschreibung: Frankreich

Wissenschaftsdisziplinen

Informatik (80%); Mathematik (20%)

Keywords

    Information Retrieval, Evaluation, Explainability

Abstract Endbericht

Bei Branchenkonferenzen für Informationssysteme (z.B. Medizin, Nachrichten, intellektuelles Eigentum) ist es leicht zu beobachten, dass in den letzten 2-3 Jahren eine Zunahme der "semantischen Suchsysteme" zu beobachten ist, die mit Hilfe der "künstlichen Intelligenz" die besten Ergebnisse für eine Vielzahl von Arbeitsaufgaben erzielen, denen eine Suchanwendung zugrunde liegt. Die Endanwender solcher Systeme haben keine Möglichkeit, den Wert dieser Systeme zu schätzen, sondern müssen den Unternehmen die sie anbieten vertrauen. Gleichzeitig haben Unternehmen, die diese suchbasierten Anwendungen entwickeln, keine zuverlässigen Werkzeuge, um die Wirksamkeitsbewertung in ihre Testverfahren zu integrieren. Die Herausforderung besteht darin, dass es in der akademischen Gemeinschaft zwar zahlreiche Benchmarks gibt, aber keine Quantifizierung der Unterschiede zwischen ihnen. Ein solcher Benchmark besteht typischerweise aus einer Reihe von Dokumenten, die von der Suchmaschine zu indexieren sind (die Dokumentsammlung), einer Reihe von Abfragen, die den Bedarf an Benutzerinformationen simulieren (die Abfragesammlung), und einer Reihe von Relevanzurteilen (die "qrel"-Sammlung). Änderungen in einem dieser Bereiche, damit ein Suchsystem eine optimale Leistung erbringen kann, müssen sich in Änderungen der Systemparameter widerspiegeln. Während Veränderungen in der Effektivität und in den Systemparametern in der Regel leicht zu beobachten oder zu messen sind, sind Veränderungen in der Benchmark derzeit schwierig, wenn nicht gar unmöglich zu messen. Aufbauend auf dem neuesten Stand der Technik im Repräsentationslernen untersucht KoDicare Methoden, um Veränderungen in den Benchmarks über die einfache Begriffsstatistik hinaus zu verstehen. Signifikante Änderungen in der Dokumentenerfassung oder im Abfragesatz müssen auf semantischer Ebene quantifiziert werden. Mit einer solchen Quantifizierung, die wir als Wissensdelta bezeichnen, werden wir Ablationsstudien durchführen können - Tests, bei denen wir in einer kontrollierten Umgebung Wissenseinheiten ändern und Unterschiede in der Leistung des Suchsystems beobachten. Die Möglichkeit, dies zu tun, hat erhebliche Auswirkungen sowohl auf die akademische Forschung (die Mittel für kontrolliertere Experimente bei der Informationsbeschaffung bereitstellt) als auch auf die Industrie (die Mittel zur Aktualisierung der Suchmaschine bereitstellt, wenn sich die Umgebung erheblich verändert hat). KoDicare bringt die Research Studios Austria Forschungsgesellschaft, das Laboratoire d`Informatique de Grenoble und Qwant SAS zusammen, um die Grundlagen für die Integration der Wirksamkeitsbewertung in zukünftige (semantische) Suchsysteme zu entwickeln.

Die Bewertung von Suchsystemen erfordert die Einrichtung einer Umgebung: Auswahl eines Paradigmas, von Metriken, eines Datensatzes usw. Die Wahl einer Umgebung ist selten objektiv begründet, und die Auswirkungen ihrer Variationen (Auswahl eines Datensatzes gegenüber einem anderen, Änderung eines Datensatzes) werden selten gemessen. Eine solche Objektivität ergibt sich aus einem quantifizierbaren Verständnis der Unterschiede zwischen Datensätzen, Dokumenten oder Testabfragen. Bei Kodicare bezeichnen wir solche Unterschiede allgemein als "Wissensdelta". Die Bewertung mehrerer Umgebungen unter Berücksichtigung ihrer Wissensdeltas führt zur Messung und Qualifizierung von "Ergebnisdeltas". Online-Systeme erfordern eine kontinuierliche Bewertung in einer stabilen und aussagekräftigen Umgebung, die die Reproduzierbarkeit und Erklärbarkeit der Systemergebnisse gewährleistet. Die Umgebung und die Ergebnisdeltas können eine solche kontinuierliche Bewertung unterstützen und Erklärungen liefern. Die theoretischen Ergebnisse werden mit realen Fällen konfrontiert, die von einem französischen Unternehmen definiert wurden, das eine Web-Suchmaschine (Qwant) einsetzt. Wissenschaftliche und technische Herausforderungen: Nach unserem Kenntnisstand gibt es aufgrund der zahlreichen zu berücksichtigenden Parameter keinen solchen Rahmen, der sich speziell mit der kontinuierlichen Bewertung von Informationsabrufsystemen befasst. Die von Kodicare vorgeschlagenen Deltas sind daher ein sinnvoller Ansatz, um dieses Problem anzugehen. Eine kontinuierliche Bewertung ist nur mit realen Fällen möglich, die ohne die Hilfe von Websuchmaschinen oft schwer zu definieren sind. Die große Beteiligung von Qwant half dem Projekt, nutzbare Szenarien zu definieren und diese zu testen.

Forschungsstätte(n)
  • Research Studios Austria - 100%
Nationale Projektbeteiligte
  • Mihai Lupu, Research Studios Austria , ehemalige:r Projektleiter:in
Internationale Projektbeteiligte
  • Philippe Mulhem, IMAG - Frankreich
  • Christophe Servan, Qwant Research - Frankreich

Research Output

  • 14 Publikationen
  • 7 Datasets & Models
Publikationen
  • 2024
    Titel Overview oftheCLEF 2024 LongEval Lab onLongitudinal Evaluation ofModel Performance; In: Experimental IR Meets Multilinguality, Multimodality, and Interaction - 15th International Conference of the CLEF Association, CLEF 2024, Grenoble, France, September 9-12, 2024, Proceedings, Part II
    DOI 10.1007/978-3-031-71908-0_10
    Typ Book Chapter
    Verlag Springer Nature Switzerland
  • 2024
    Titel LongEval: Longitudinal Evaluation ofModel Performance atCLEF 2024; In: Advances in Information Retrieval - 46th European Conference on Information Retrieval, ECIR 2024, Glasgow, UK, March 24-28, 2024, Proceedings, Part VI
    DOI 10.1007/978-3-031-56072-9_8
    Typ Book Chapter
    Verlag Springer Nature Switzerland
  • 2024
    Titel AMATU@ SimpleText2024: are LLMs any good for scientific leaderboard extraction
    Typ Other
    Autor Alaa El-Ebshihy
    Konferenz Conference and Labs of the Evaluation Forum (CLEF 2024)
    Link Publikation
  • 2024
    Titel Extended overview of the CLEF 2024 LongEval Lab on Longitudinal Evaluation of Model Performance
    Typ Other
    Autor Hsuvas Borkakoty
    Konferenz Conference and Labs of the Evaluation Forum (CLEF 2024)
    Link Publikation
  • 2026
    Titel LongEval atCLEF 2025: Longitudinal Evaluation ofIR Systems onWeb andScientific Data; In: Experimental IR Meets Multilinguality, Multimodality, and Interaction - 16th International Conference of the CLEF Association, CLEF 2025, Madrid, Spain, September 9-12, 2025, Proceedings
    DOI 10.1007/978-3-032-04354-2_20
    Typ Book Chapter
    Verlag Springer Nature Switzerland
  • 2025
    Titel LongEval atCLEF 2025: Longitudinal Evaluation ofIR Model Performance; In: Advances in Information Retrieval - 47th European Conference on Information Retrieval, ECIR 2025, Lucca, Italy, April 6-10, 2025, Proceedings, Part V
    DOI 10.1007/978-3-031-88720-8_58
    Typ Book Chapter
    Verlag Springer Nature Switzerland
  • 2025
    Titel Benchmark Creation forNarrative Knowledge Delta Extraction Tasks: Can LLMs Help?; In: Advances in Information Retrieval - 47th European Conference on Information Retrieval, ECIR 2025, Lucca, Italy, April 6-10, 2025, Proceedings, Part III
    DOI 10.1007/978-3-031-88714-7_32
    Typ Book Chapter
    Verlag Springer Nature Switzerland
  • 2025
    Titel Extended Abstract of LongEval at CLEF 2025: Longitudinal Evaluation of IR Systems on Web and Scientific Data
    Typ Other
    Autor Alaa El-Ebshihy
    Konferenz Conference and Labs of the Evaluation Forum (CLEF 2025)
    Link Publikation
  • 2023
    Titel LongEval: Longitudinal Evaluation ofModel Performance atCLEF 2023; In: Advances in Information Retrieval - 45th European Conference on Information Retrieval, ECIR 2023, Dublin, Ireland, April 2-6, 2023, Proceedings, Part III
    DOI 10.1007/978-3-031-28241-6_58
    Typ Book Chapter
    Verlag Springer Nature Switzerland
  • 2023
    Titel Predicting Retrieval Performance Changes inEvolving Evaluation Environments; In: Experimental IR Meets Multilinguality, Multimodality, and Interaction - 14th International Conference of the CLEF Association, CLEF 2023, Thessaloniki, Greece, September 18-21, 2023, Proceedings
    DOI 10.1007/978-3-031-42448-9_3
    Typ Book Chapter
    Verlag Springer Nature Switzerland
  • 2023
    Titel Extended Overview of the CLEF-2023 LongEval Lab on Longitudinal Evaluation of Model Performance
    Typ Other
    Autor Alkhalifa R
    Konferenz Conference and Labs of the Evaluation Forum (CLEF 2023)
    Link Publikation
  • 2023
    Titel Towards Result Delta Prediction Based on Knowledge Deltas for Continuous IR Evaluation
    Typ Other
    Autor Alaa El-Ebshihy
    Konferenz Proceedings of the workshop QPP++ 2023: Query Performance Prediction and Its Evaluation in New Tasks, co-located with The 45th European Conference on Information Retrieval (ECIR)
    Link Publikation
  • 2023
    Titel LongEval-Retrieval: French-English Dynamic Test Collection for Continuous Web Search Evaluation
    DOI 10.1145/3539618.3591921
    Typ Conference Proceeding Abstract
    Autor Deveaud R
    Seiten 3086-3094
  • 2023
    Titel LongEval-Retrieval: French-English Dynamic Test Collection for Continuous Web Search Evaluation
    DOI 10.48550/arxiv.2303.03229
    Typ Preprint
    Autor Deveaud P
    Link Publikation
Datasets & Models
  • 2025 Link
    Titel LongEval 2025 Web Retrieval Collection
    DOI 10.48436/th5h0-g5f51
    Typ Database/Collection of data
    Öffentlich zugänglich
    Link Link
  • 2025 Link
    Titel LongEval 2025 CORE Retrieval Test Collection
    DOI 10.48436/v8phe-g8911
    Typ Database/Collection of data
    Öffentlich zugänglich
    Link Link
  • 2025 Link
    Titel LongEval 2025 CORE Retrieval Train Collection
    DOI 10.48436/r643n-yc044
    Typ Database/Collection of data
    Öffentlich zugänglich
    Link Link
  • 2024 Link
    Titel LongEval Train Collection
    Typ Database/Collection of data
    Öffentlich zugänglich
    Link Link
  • 2024 Link
    Titel LongEval 2024 Train Collection
    DOI 10.48436/y60e9-k9b51
    Typ Database/Collection of data
    Öffentlich zugänglich
    Link Link
  • 2024 Link
    Titel LongEval 2024 Test Collection
    DOI 10.48436/xr350-79683
    Typ Database/Collection of data
    Öffentlich zugänglich
    Link Link
  • 2023 Link
    Titel kodicare_framework
    Typ Computer model/algorithm
    Öffentlich zugänglich
    Link Link

Entdecken, 
worauf es
ankommt.

Newsletter

FWF-Newsletter Presse-Newsletter Kalender-Newsletter Job-Newsletter scilog-Newsletter

Kontakt

Österreichischer Wissenschaftsfonds FWF
Georg-Coch-Platz 2
(Eingang Wiesingerstraße 4)
1010 Wien

office(at)fwf.ac.at
+43 1 505 67 40

Allgemeines

  • Jobbörse
  • Arbeiten im FWF
  • Presse
  • Philanthropie
  • scilog
  • Geschäftsstelle
  • Social Media Directory
  • LinkedIn, externe URL, öffnet sich in einem neuen Fenster
  • , externe URL, öffnet sich in einem neuen Fenster
  • Facebook, externe URL, öffnet sich in einem neuen Fenster
  • Instagram, externe URL, öffnet sich in einem neuen Fenster
  • YouTube, externe URL, öffnet sich in einem neuen Fenster
  • Cookies
  • Hinweisgeber:innensystem
  • Barrierefreiheitserklärung
  • Datenschutz
  • Impressum
  • IFG-Formular
  • Social Media Directory
  • © Österreichischer Wissenschaftsfonds FWF
© Österreichischer Wissenschaftsfonds FWF