Lorenz Sparrenberg

Über mich

Mein Name ist Lorenz Sparrenberg. Ich bin Data Scientist aus Bonn, promoviert in Biotechnologie an der RWTH Aachen. Zu Machine Learning kam ich über die Biologie: In meiner Dissertation habe ich im großen Maßstab Fluoreszenz-Daten von DNA-Moleküle ausgewertet und dabei früh gemerkt, dass es ohne Methoden der Data Science kaum möglich ist, Informationen aus umfangreichen Messdaten zu gewinnen.

Heute beschäftigt mich diese Frage hauptberuflich. Als Post-Doc am Applied Machine Learning Lab der Universität Bonn forsche ich zu Large Language Models, quantisierter Inferenz und multimodalem Lernen. Als selbständiger Data Scientist übersetze ich diese Methoden in konkrete Anwendungen für Unternehmen.

Publikationen

  • 2026 Chopra, M; Sparrenberg, L; Sifa, R. Towards Reliable Machine Translation: Scaling LLMs for Critical Error Detection and Safety. arXiv preprint arXiv:2602.11444, 2026.
  • 2026 Moustafa, W; Elsafty, H; Schneider, H; Sparrenberg, L; Sifa, R. Generalizing Abstention for Noise-Robust Learning in Medical Image Segmentation. arXiv preprint arXiv:2601.14039, 2026.
  • 2025 Deußer, T; Sparrenberg, L; Berger, A; Hahnbück, M; Bauckhage, C; Sifa, R. A survey on current trends and recent advances in text anonymization. 2025 IEEE 12th International Conference on Data Science and Advanced Analytics (DSAA).
  • 2025 Berger, A; Khanna, S; Sparrenberg, L; Deußer, T; Berghaus, D; Sifa, R. Reasoning LLMs in the Medical Domain: A Literature Survey. 2025 IEEE 12th International Conference on Data Science and Advanced Analytics (DSAA).
  • 2025 Khanna, S; Berger, A; Berghaus, D; Deußer, T; Sparrenberg, L; Sifa, R. Towards Unified Multimodal Financial Forecasting: Integrating Sentiment Embeddings and Market Indicators via Cross-Modal Attention. 2025 IEEE 12th International Conference on Data Science and Advanced Analytics (DSAA).
  • 2025 Sparrenberg, L; Deußer, T; Berger, A; Sifa, R. Small and Fast LLMs on Commodity Hardware: Post-Training Quantization in llama.cpp. 2025 IEEE 12th International Conference on Data Science and Advanced Analytics (DSAA).
  • 2025 Schneider, T; Sparrenberg, L; Sifa, R. Predicting Player Churn with LLMs: A Comprehensive Evaluation of World Knowledge and Reasoning. 2025 IEEE 12th International Conference on Data Science and Advanced Analytics (DSAA).
  • 2025 Sparrenberg, L; Schneider, T; Deußer, T; Berger, A; Sifa, R. Towards Uncertainty-Aware Low-Bit Quantized LLMs for On-Device Inference. 2025 IEEE International Conference on Big Data (BigData), 5930-5939.
  • 2025 Yilmaz, U; Karadeniz, C; Demirkaya, B; Sparrenberg, L; Toraman, D; et al. Cognitive Fingerprinting of Attention-Deficit/Hyperactivity Disorder Subtypes via Artificial Intelligence-Driven Virtual Reality. AI in Neuroscience 1(4), 149-157.
  • 2025 Chopra, M; Sparrenberg, L; Khanna, S; Sifa, R. How Small Can You Go? Compact Language Models for On-Device Critical Error Detection in Machine Translation. arXiv preprint arXiv:2511.09748.
  • 2025 Chopra, M; Sparrenberg, L; Sifa, R. SynCED-EnDe 2025: A Synthetic and Curated English-German Dataset for Critical Error Detection in Machine Translation. arXiv preprint arXiv:2510.05144.
  • 2025 Chopra, M; Sparrenberg, L; Sifa, R. From Retinal Pixels to Patients: Evolution of Deep Learning Research in Diabetic Retinopathy Screening. arXiv preprint arXiv:2511.11065.
  • 2024 Deußer, T; Zhao, C; Sparrenberg, L; Uedelhoven, D; Berger, A; Pielka, M; et al. A comparative study of large language models for named entity recognition in the legal domain. 2024 IEEE International Conference on Big Data (BigData), 4737-4742.
  • 2024 Deußer, T; Siddiqi, AM; Sparrenberg, L; Adams, T; Bauckhage, C; Sifa, R. Fusing speech and language models for dementia detection. 2024 IEEE International Conference on Big Data (BigData), 3908-3914.
  • 2024 Sparrenberg, L; Schneider, T; Deußer, T; Koppenborg, M; Sifa, R. Correcting systematic bias in LLM-generated dialogues using big five personality traits. 2024 IEEE International Conference on Big Data (BigData), 3061-3069.
  • 2024 Deußer, T; Zhao, C; Uedelhoven, D; Sparrenberg, L; Hillebrand, L; et al. Leveraging large language models for few-shot KPI extraction from financial reports. 2024 IEEE International Conference on Big Data (BigData), 4864-4868.
  • 2023 Sparrenberg, LT. The analysis of fluorescence fluctuations by means of the mean single-molecule rate (mSMR). Dissertation, RWTH Aachen University, 2023.
  • 2022 Greiner, B; Sparrenberg, L; Berwanger, K. Method for determining the concentration of a fluorescent and/or fluorescence-labeled analyte, and calibration method for preparing such determination. US Patent 11,255,784, 2022.
  • 2021 Sparrenberg, LT; Greiner, B; Mathis, HP. The Mean Single Molecule Rate (mSMR) in the Analysis of Fluorescence Fluctuations: Measurements on DNA Mixtures of Defined Composition. Journal of Fluorescence 31(6): 1883-1894, 2021.
  • 2020 Sparrenberg, LT; Greiner, B; Mathis, HP. Bleaching correction for DNA measurements in highly diluted solutions using confocal microscopy. PLoS ONE 15(7):1-17, 2020.
  • 2018 Greiner, B; Sparrenberg, LT; Berwanger, K. Verfahren zur Bestimmung der Konzentration eines fluoreszierenden und/oder fluoreszenzmarkierten Analyten und Kalibrierverfahren zur Vorbereitung dieser Bestimmung. Patent EP3644047 A1, 2018.
  • 2017 Sparrenberg, LT; Greiner, B; Mueller, CM; Mathis, HP. Time-resolved measurements of DNA interactions in an electrowetting-on-dielectric system using confocal microscopy. Journal of Physics: Conference Series, 922, 28th Micromechanics and Microsystems Europe Workshop, Uppsala, Sweden, 2017.
Lorenz Sparrenberg bei der Arbeit

Lehre & Forschung

Seit 2023 bin ich als Post-Doc am Applied Machine Learning Lab (Informatik III) der Rheinischen Friedrich-Wilhelms-Universität Bonn tätig, angestellt über das Lamarr-Institut für Maschinelles Lernen und Künstliche Intelligenz im Forschungsbereich Hybrid Machine Learning. Dort forsche und lehre ich an der Schnittstelle von Machine Learning und Biologie.

Forschungsinteressen

Meine Forschung befasst sich mit Large Language Models: ihrer Bewertung, Robustheit und ihrem Einsatz unter realen Randbedingungen. Die thematische Spannweite reicht von effizienter Inferenz bis hin zu multimodalem Lernen für klinische und entscheidungsunterstützende Anwendungen. Darüber hinaus beschäftige ich mich mit biologisch inspirierten Ansätzen: Spiking Neural Networks, Curriculum Learning nach biologischen Entwicklungsphasen, Repräsentationslernen und Weltmodelle sowie Alternativen zu Transformern wie State Space Models.

Lehrveranstaltungen

Mining Media Data I

Vorlesung

Fortgeschrittene Data-Mining-Methoden für die Analyse von Mediendaten: Affinity Mining, Latent Pattern Mining, neuronale Netze und Archetypal Analysis. Die Studierenden erarbeiten Anwendungen in Behavioral Profiling, Empfehlungssystemen und Outlier Detection. Im Fokus stehen mathematische Optimierung, interpretierbare Modelle und praxisnahe Fallstudien.

Hybrid Learning and Applications

Lab

Einführung in hybrides Lernen an der Schnittstelle klassischer Machine-Learning-Verfahren und Deep Learning. Studierende integrieren Foundation Models mit Downstream-Aufgaben, wählen eigene Projektthemen und sammeln praktische Erfahrung in Datenaufbereitung, Modellentwicklung, Evaluation und Optimierung.

Explainable AI and Applications

Lab

Hands-on-Forschung zu latenten Repräsentationen (Text- und Bild-Embeddings, Sentiment Analysis) mit dem Ziel, bestehende Arbeiten zu reproduzieren und durch neurosymbolisches Repräsentationslernen besser zu verstehen. Exzellente Ergebnisse bieten die Möglichkeit zur Publikation.

  • Studium 2010–2016: Angewandte und Molekulare Biotechnologie, RWTH Aachen University
  • Wissenschaftlicher Mitarbeiter 2016–2022: Fraunhofer-Institut für Angewandte Informationstechnik (FIT), Sankt Augustin
  • Selbstständiger Data Scientist Seit 2022: Bonn
  • Promotion 2023: Biotechnologie, RWTH Aachen University
  • Post-Doc Seit 2023: Applied Machine Learning Lab, Informatik III, Universität Bonn