Interactive Spreadsheet Debugging
Interactive Spreadsheet Debugging
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Testing,
Spreadsheets,
End User Programming,
Debugging
Elektronische Tabellenkalkulationen (Spreadsheets), die oft auf der Basis von Microsoft Excel erstellt werden, werden in Organisationen für verschiedenste Zwecke eingesetzt, zum Beispiel für die Budgetierung und Finanzplanung. In vielen Fällen dienen die Berechnungen in Tabellenkalkulationen als Basis für kaufmännische Entscheidungen. Fehler in Tabellenkalkulationen können daher ein erhebliches Risiko für die Organisation darstellen und es gibt mittlerweile zahlreiche Beispiele, wo Fehler in Tabellenkalkulationen zu finanziellen Schäden geführt haben. Leider sind Fehler in Tabellenkalkulationen nicht selten und Studien zeigen, dass die Wahrscheinlichkeit, dass eine komplexe Tabellenkalkulation mindestens einen Fehler beinhaltet, relativ groß ist. Verschiedene Maßnahmen können ergriffen werden, um das Risiko zu verringern, dass Fehler in der Tabellenkalkulation unentdeckt bleiben, bevor sie eingesetzt wird. Ein möglicher Ansatz liegt darin, dem Benutzer bessere Werkzeuge an die Hand zu geben, um eine Tabellenkalkulation auf Korrektheit hin zu überprüfen oder um die konkreten Stellen zu finden, die zu einem falschen Berechnungsergebnis geführt haben. Für den letztgenannten Ansatz, die Identifikation von fehlerhaften Formeln, wurden in der Literatur verschiedene Algorithmen vorgeschlagen, die das Ziel haben eine sortierte Liste von verdächtigen Formeln zu erstellen. Kürzlich erschienene Forschungsarbeiten stellen aber die These auf, dass die Bereitstellung einer solchen Liste von Fehlerkandidaten als einziges Mittel zur Fehlerbehebung (debugging) unzureichend für den Benutzer sein kann. In diesem Projekt werden wir daher neue Ansätze zum interaktiven Debugging von Tabellenkalkulationen untersuchen, wobei wir auf den Ergebnissen unserer aktuellen Forschungsarbeiten im Bereich algorithmischer Fehleridentifikation aufbauen werden. Konkret werden wir Ansätze betrachten, in denen der Benutzer vom System in einem iterativen Prozess interaktiv zur wahren Fehlerursache geführt wird. Außerdem werden wir Erklärungsmechanismen entwerfen, welche es dem Benutzer erlauben, das System zu befragen, warum bestimmte Berechnungsergebnisse zustande gekommen sind. Um diese Ziele zu erreichen und Interaktionen in Echtzeit zu ermöglichen, werden wir zudem die zugrundeliegenden algorithmischen Ansätze weiter verbessern. Den aktuellen Forschungstrends im Bereich Softwareentwicklung folgend, werden wir die von uns vorgeschlagenen Ansätze nicht nur auf Basis von Simulationsexperimenten, sondern auch mithilfe von verschiedenen Benutzerstudien empirisch validieren. Als Zusatzergebnis werden wir dadurch neue Erkenntnisse über das konkrete Verhalten von Benutzern bei der Erstellung von Tabellenkalkulationen und bei der Fehlersuche erhalten.
Elektronische Tabellenkalkulationen (Spreadsheets), die oft auf der Basis von Microsoft Excel erstellt werden, werden in Organisationen für verschiedenste Zwecke eingesetzt, zum Beispiel für die Budgetierung und Finanzplanung. In vielen Fällen dienen die Berechnungen in Tabellenkalkulationen als Basis für kaufmännische Entscheidungen. Fehler in Tabellenkalkulationen können daher ein erhebliches Risiko für die Organisation darstellen und es gibt mittlerweile zahlreiche Beispiele, wo Fehler in Tabellenkalkulationen zu finanziellen Schäden geführt haben. Leider sind Fehler in Tabellenkalkulationen nicht selten und Studien zeigen, dass die Wahrscheinlichkeit, dass eine komplexe Tabellenkalkulation mindestens einen Fehler beinhaltet, relativ groß ist. Verschiedene Maßnahmen können ergriffen werden, um das Risiko zu verringern, dass Fehler in der Tabellenkalkulation unentdeckt bleiben, bevor sie eingesetzt wird. Ein möglicher Ansatz liegt darin, dem Benutzer bessere Werkzeuge an die Hand zu geben, um eine Tabellenkalkulation auf Korrektheit hin zu überprüfen oder um die konkreten Stellen zu finden, die zu einem falschen Berechnungsergebnis geführt haben. Für den letztgenannten Ansatz, die Identifikation von fehlerhaften Formeln, wurden in der Literatur verschiedene Algorithmen vorgeschlagen, die das Ziel haben eine sortierte Liste von "verdächtigen" Formeln zu erstellen. Kürzlich erschienene Forschungsarbeiten stellen aber die These auf, dass die Bereitstellung einer solchen Liste von Fehlerkandidaten als einziges Mittel zur Fehlerbehebung ("debugging") unzureichend für den Benutzer sein kann. In diesem Projekt wurden neue Ansätze zum interaktiven Debugging von Tabellenkalkulationen untersucht. Konkret wurden dabei Algorithmen entwickelt, in denen der Benutzer vom System in einem iterativen Prozess interaktiv zur wahren Fehlerursache geführt wird. Außerdem wurden Erklärungsmechanismen entworfen, welche es dem Benutzer zu verstehen erlauben, warum eine Formel vom System als möglicherweise fehlerhaft markiert wurde. Im Bereich der algorithmischen Forschung wurden sowohl Ansätze der klassischen Künstlichen Intelligenz als auch neue Verfahren auf Basis von maschinellem Lernen entworfen oder weiterentwickelt. Die Forschung zielte dabei sowohl darauf ab, die Fehlervorhersagegenauigkeit der Verfahren zu erhöhen als auch den erforderlichen rechnerischen Aufwand zu verringern. Die erzielten Forschungsergebnisse wurden erfolgreich in renommierten wissenschaftlichen Publikationsorganen sowohl im Bereich der künstlichen Intelligenz als auch im Bereich des Software Engineering veröffentlicht. Da rein daten- oder simulationsbasierte Ansätze nur teilweise aussagekräftig für den Nutzen eines Debugging-Werkzeugs sind, wurden im Rahmen des Projekts zwei wichtige Studien mit Benutzern durchgeführt. Die Studien lieferten wichtige Erkenntnisse darüber, wie Benutzer mit solchen Werkzeugen umgehen. Insbesondere ist aufgefallen, dass sich manche Benutzer in zu hohem Ausmaß auf das Werkzeug verlassen und sich zu stark auf diejenigen Fehler konzentrieren, die das Werkzeug als möglicherweise fehlerhaft hervorhebt. Die zweite Studie ergab, dass die Bereitstellung von Erklärungen für Benutzer bei der Fehleranalyse hilfreich sein kann. Die Ergebnisse dieser Studien wurden in zwei Aufsätzen in einem renommierten Journal im Bereich des Sofware Engineering publiziert.
- Technische Universität Graz - 40%
- Universität Klagenfurt - 60%
- Franz Wotawa, Technische Universität Graz , assoziierte:r Forschungspartner:in
- Rui Abreu, University of Lisbon - Portugal
Research Output
- 43 Zitationen
- 37 Publikationen
- 3 Datasets & Models
- 1 Wissenschaftliche Auszeichnungen
-
2024
Titel Sequential Model-Based Diagnosis by Systematic Search (Abstract Reprint) DOI 10.1609/aaai.v38i20.30609 Typ Journal Article Autor Rodler P Journal Proceedings of the AAAI Conference on Artificial Intelligence -
2024
Titel Investigating Reproducibility in Deep Learning-Based Software Fault Prediction DOI 10.48550/arxiv.2402.05645 Typ Preprint Autor Jannach D Link Publikation -
2023
Titel Explaining software fault predictions to spreadsheet users DOI 10.1016/j.jss.2023.111676 Typ Journal Article Autor Hofer B Journal Journal of Systems and Software -
2024
Titel Investigating Reproducibility in Deep Learning-Based Software Fault Prediction DOI 10.1109/qrs62785.2024.00038 Typ Conference Proceeding Abstract Autor Jannach D Seiten 306-317 -
2025
Titel Choosing abstraction levels for model-based software debugging: A theoretical and empirical analysis for spreadsheet programs DOI 10.1016/j.artint.2025.104399 Typ Journal Article Autor Hofer B Journal Artificial Intelligence -
2023
Titel DynamicHS: Streamlining Reiter's Hitting-Set Tree for Sequential Diagnosis DOI 10.1016/j.ins.2022.08.029 Typ Journal Article Autor Rodler P Journal Information Sciences -
2023
Titel Memory-Limited Model-Based Diagnosis (Extended Abstract) DOI 10.24963/ijcai.2023/789 Typ Conference Proceeding Abstract Autor Rodler P Seiten 6954-6958 -
2023
Titel Sequential model-based diagnosis by systematic search DOI 10.1016/j.artint.2023.103988 Typ Journal Article Autor Rodler P Journal Artificial Intelligence -
2023
Titel How Should I Compute My Candidates? A Taxonomy and Classification of Diagnosis Computation Algorithms; In: ECAI 2023 - 26th European Conference on Artificial Intelligence, September 30-October 4, 2023, Krakw, Poland - Including 12th Conference on Prestigious Applications of Intelligent Systems (PAIS 2023) DOI 10.3233/faia230490 Typ Book Chapter Verlag IOS Press -
2023
Titel Advancing Spreadsheet Quality Assurance: A Novel Fault Localization Approach, User-Centric Evaluations of Explainable Faults, and Tool Over-reliance Typ Other Autor Mukhtar A -
2023
Titel Don't Treat the Symptom, Find the Cause! Efficient Artificial-Intelligence Methods for (Interactive) Debugging Typ Other Autor Rodler P Link Publikation -
2022
Titel Boosting Spectrum-Based Fault Localization for Spreadsheets with Product Metrics in a Learning Approach DOI 10.5281/zenodo.6826794 Typ Conference Proceeding Abstract Autor Hofer B Link Publikation -
2022
Titel Boosting Spectrum-Based Fault Localization for Spreadsheets with Product Metrics in a Learning Approach DOI 10.5281/zenodo.6826795 Typ Conference Proceeding Abstract Autor Hofer B Link Publikation -
2022
Titel Boosting Spectrum-Based Fault Localization for Spreadsheets with Product Metrics in a Learning Approach DOI 10.1145/3551349.3559546 Typ Conference Proceeding Abstract Autor Mukhtar A Seiten 1-5 Link Publikation -
2021
Titel Randomized Problem-Relaxation Solving for Over-Constrained Schedules DOI 10.24963/kr.2021/72 Typ Conference Proceeding Abstract Autor Rodler P Seiten 696-701 -
2022
Titel Random vs. Best-First: Impact of Sampling Strategies on Decision Making in Model-Based Diagnosis DOI 10.1609/aaai.v36i5.20531 Typ Journal Article Autor Rodler P Journal Proceedings of the AAAI Conference on Artificial Intelligence Seiten 5869-5878 Link Publikation -
2021
Titel Linear-Space Best-First Diagnosis Search DOI 10.1609/socs.v12i1.18579 Typ Journal Article Autor Rodler P Journal Proceedings of the International Symposium on Combinatorial Search Seiten 188-190 Link Publikation -
2021
Titel Too Good to Throw Away: A Powerful Reuse Strategy for Reiter's Hitting Set Tree DOI 10.1609/socs.v11i1.18527 Typ Journal Article Autor Rodler P Journal Proceedings of the International Symposium on Combinatorial Search Seiten 135-136 Link Publikation -
2021
Titel Appendix to the Paper: DynamicHS: Streamlining Reiter's Hitting Set Tree for Sequential Diagnosis Typ Other Autor Rodler P Link Publikation -
2022
Titel Memory-limited model-based diagnosis DOI 10.1016/j.artint.2022.103681 Typ Journal Article Autor Rodler P Journal Artificial Intelligence Seiten 103681 Link Publikation -
2022
Titel Spreadsheet debugging: The perils of tool over-reliance DOI 10.1016/j.jss.2021.111119 Typ Journal Article Autor Mukhtar A Journal Journal of Systems and Software Seiten 111119 Link Publikation -
2022
Titel One step at a time: An efficient approach to query-based ontology debugging DOI 10.1016/j.knosys.2022.108987 Typ Journal Article Autor Rodler P Journal Knowledge-Based Systems Seiten 108987 Link Publikation -
2022
Titel A formal proof and simple explanation of the QuickXplain algorithm DOI 10.1007/s10462-022-10149-w Typ Journal Article Autor Rodler P Journal Artificial Intelligence Review Seiten 6185-6206 Link Publikation -
2021
Titel Comprehending Spreadsheets: Which Strategies do Users Apply? DOI 10.1109/icpc52881.2021.00044 Typ Conference Proceeding Abstract Autor Hodnigg K Seiten 386-390 -
2021
Titel Product metrics for spreadsheets—A systematic review DOI 10.1016/j.jss.2021.110910 Typ Journal Article Autor Hofer B Journal Journal of Systems and Software Seiten 110910 Link Publikation -
2022
Titel How should I compute my candidates? A taxonomy and classification of diagnosis computation algorithms Typ Conference Proceeding Abstract Autor Rodler P Konferenz 33rd International Workshop on Principle of Diagnosis - DX 2022 Link Publikation -
2022
Titel Appendix to the Paper: Sequential Model-Based Diagnosis by Systematic Search Typ Other Autor Rodler P Link Publikation -
2022
Titel RBF-HS: Recursive best-first hitting set search Typ Other Autor Rodler P Link Publikation -
2021
Titel AI-based Spreadsheet Debugging DOI 10.1142/9789811239922_0013 Typ Book Chapter Autor Schekotihin K Verlag World Scientific Publishing Seiten 371-399 -
2020
Titel Understanding the QuickXPlain algorithm: Simple explanation and formal proof Typ Other Autor Rodler P Link Publikation -
2020
Titel On Expert Behaviors and Question Types for Efficient Query-Based Ontology Fault Localization Typ Other Autor Rodler P Link Publikation -
2020
Titel DynamicHS: Optimizing Reiter's HS-Tree for Sequential Diagnosis Typ Conference Proceeding Abstract Autor Rodler P Konferenz 31st International Workshop on Principles of Diagnosis: DX-2020 Link Publikation -
2020
Titel Do we really sample right in model-based diagnosis? Typ Conference Proceeding Abstract Autor Elichanova F Konferenz 31st International Workshop on Principles of Diagnosis: DX-2020 Link Publikation -
2020
Titel The Scheduling Job-Set Optimization Problem: A Model-Based Diagnosis Approach Typ Conference Proceeding Abstract Autor Rodler P Konferenz 31st International Workshop on Principles of Diagnosis: DX-2020 Link Publikation -
2020
Titel Sound, Complete, Linear-Space, Best-First Diagnosis Search Typ Conference Proceeding Abstract Autor Rodler P Konferenz 31st International Workshop on Principles of Diagnosis: DX-2020 Link Publikation -
2020
Titel Reuse, Reduce and Recycle: Optimizing Reiter's HS-Tree for Sequential Diagnosis Typ Conference Proceeding Abstract Autor Rodler P Konferenz ECAI 2020 Seiten 873-880 Link Publikation -
0
DOI 10.1145/3551349 Typ Other
-
2023
Link
Titel Explaining Software Fault Predictions to Spreadsheet Users DOI 10.5281/zenodo.7676963 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2022
Link
Titel Learning- and Spectrum-Based Fault Localization for Spreadsheets DOI 10.5281/zenodo.6826795 Typ Computer model/algorithm Öffentlich zugänglich Link Link -
2021
Link
Titel Spreadsheet Debugging: The Perils of Tool Over-reliance DOI 10.5281/zenodo.5533461 Typ Database/Collection of data Öffentlich zugänglich Link Link
-
2023
Titel Recent advances in debugging spreadsheets Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International