Profile – Machine Learning Lab

PhD Student, Tabular Data

Lennart Purucker

Postal address

Institut für Informatik
Albert-Ludwigs-Universität Freiburg
Sekretariat Hutter/Maschinelles Lernen
Georges-Köhler-Allee 074
79110 Freiburg, Germany

Office

Building 074, Room 00-012

purucker@cs.uni-freiburg.de

Publications

About

I am a Ph.D. student at the University of Freiburg, Germany, supervised by Frank Hutter. My Ph.D. position is part of the Small Data Initiative (CRC 1597, Project C05). My research interest is in the field of artificial intelligence, with a focus on automated machine learning, ensemble learning, deep learning, and meta-learning (for small data). My primary focus is on tabular data (e.g., Excel sheets), but I also work on vision, text, and time series data.

I completed my bachelor’s degree in applied computer science in 2019 at the DHBW Stuttgart and my master’s degree in computer science in 2021 at the RWTH Aachen. From November 2021 to August 2023, I worked as a research assistant at the University of Siegen on ensemble learning for automated machine learning (AutoML) and recommender systems. From August 2023 to November 2023, I was an applied scientist intern at AWS as part of the AutoGluon team.

In 2024, I mainly worked on TabPFN, a foundation model for (small) tabular data. Furthermore, I participated in Kaggle's AutoML Grand Prix, as leader of the “AutoML Grandmasters” team, where we scored a very close (1 point) second place with AutoGluon and TabPFN to win $20,000.

At the start of 2025, we published our newest version of TabPFN in Nature. For the rest of the year, I embarked on a new mission: creating reliable, rigors benchmarks for tabular data. We started with a living benchmark for IID tabular data – TabArena.

Other

Community Involvement:

Reproducibility Chair at the AutoML Conference 2023, 2024, and 2025.
Co-organizer of the AutoML Seminar
Co-organizer of the ICML'25 Workshop on Foundation Models for Structured Data
Developer of AutoGluon (Tabular)
Member of the OpenML Team (Python API)
Core Maintainer of TabArena

Reviewing:

2025: AutoML, KDD
2024: AutoML, NeurIPS DBT, CVPR Workshop on Foundation Models for Medical Vision, ICML ICL Workshop, ICLR
2023: Reproducibility Reviewer at the AutoML Conference

Teaching:

Publications

2025

Bischl, Bernd; Casalicchio, Giuseppe; Das, Taniya; Feurer, Matthias; Fischer, Sebastian; Gijsbers, Pieter; Mukherjee, Subhaditya; Müller, Andreas C; Németh, László; Oala, Luis; Purucker, Lennart; Ravi, Sahithya; van Rijn, Jan N; Singh, Prabhant; Vanschoren, Joaquin; van der Velde, Jos; Wever, Marcel

OpenML: Insights from 10 years and more than a thousand papers Inproceedings

In: Patterns, Elsevier, 2025.

Feuer, Benjamin; Purucker, Lennart; Elachqar, Oussama; Hegde, Chinmay

MARVIS: Modality Adaptive Reasoning over VISualizations Inproceedings

In: Preprint, 2025.

Erickson, Nick; Purucker, Lennart; Tschalzev, Andrej; Holzmüller, David; Desai, Prateek Mutalik; Salinas, David; Hutter, Frank

TabArena: A Living Benchmark for Machine Learning on Tabular Data Inproceedings

In: Preprint, 2025.

Bühler, Magnus; Purucker, Lennart; Hutter, Frank

Towards Synthetic Data for Fine-tuning Tabular Foundation Models Inproceedings

In: Foundation Models for Structured Data workshop at ICML, 2025.

Küken, Jaris; Purucker, Lennart; Hutter, Frank

Early Stopping Tabular In-Context Learning Inproceedings

In: Foundation Models for Structured Data workshop at ICML, 2025.

Mráz, Martin; Das, Breenda; Gupta, Anshul; Purucker, Lennart; Hutter, Frank

Towards Benchmarking Foundation Models for Tabular Data With Text Inproceedings

In: Foundation Models for Structured Data workshop at ICML, 2025.

Garg, Anurag; Ali, Muhammad; Hollmann, Noah; Purucker, Lennart; Müller, Samuel; Hutter, Frank

Real-TabPFN: Improving Tabular Foundation Models via Continued Pre-training With Real-World Data Inproceedings

In: Foundation Models for Structured Data workshop at ICML, 2025.

Arango, Sebastian Pineda; Janowski, Maciej; Purucker, Lennart; Zela, Arber; Hutter, Frank; Grabocka, Josif

Regularized Neural Ensemblers Inproceedings

In: AutoML Conference 2025, 2025.

Heinzel, Carola Sophia; Purucker, Lennart; Hutter, Frank; Pfaffelhuber, Peter

Advancing biogeographical ancestry predictions through machine learning Inproceedings

In: Forensic Science International: Genetics, Elsevier, 2025.

Tschalzev, Andrej; Purucker, Lennart; Lüdtke, Stefan; Hutter, Frank; Bartelt, Christian; Stuckenschmidt, Heiner

Unreflected Use of Tabular Data Repositories Can Undermine Research Quality Inproceedings

In: The Future of Machine Learning Data Practices and Repositories at ICLR, 2025, (Spotlight).

Hollmann, Noah; Müller, Samuel; Purucker, Lennart; Krishnakumar, Arjun; Körfer, Max; Hoo, Shi Bin; Schirrmeister, Robin Tibor; Hutter, Frank

Accurate predictions on small data with a tabular foundation model Journal Article

In: Nature, vol. 637, iss. 8045, pp. 319–326, 2025, (Nature).

Pfefferle, Alexander; Purucker, Lennart; Hutter, Frank

DAFT: Data-Aware Fine-Tuning of Foundation Models for Efficient and Effective Medical Image Segmentation Inproceedings

In: Ma, Jun; Zhou, Yuyin; Wang, Bo (Ed.): Medical Image Segmentation Foundation Models. CVPR 2024 Challenge: Segment Anything in Medical Images on Laptop, pp. 15–38, Springer Nature Switzerland, Cham, 2025, ISBN: 978-3-031-81854-7.

2024

Ma, Jun; Li, Feifei; Kim, Sumin; Asakereh, Reza; Le, Bao-Hiep; Nguyen-Vu, Dang-Khoa; Pfefferle, Alexander; Wei, Muxin; Gao, Ruochen; Lyu, Donghang; Yang, Songxiao; Purucker, Lennart; Marinov, Zdravko; Staring, Marius; Lu, Haisheng; Dao, Thuy Thanh; Ye, Xincheng; Li, Zhi; Brugnara, Gianluca; Vollmuth, Philipp; Foltyn-Dumitru, Martha; Cho, Jaeyoung; Mahmutoglu, Mustafa Ahmed; Bendszus, Martin; Pflüger, Irada; Rastogi, Aditya; Ni, Dong; Yang, Xin; Zhou, Guang-Quan; Wang, Kaini; Heller, Nicholas; Papanikolopoulos, Nikolaos; Weight, Christopher; Tong, Yubing; Udupa, Jayaram K; Patrick, Cahill J.; Wang, Yaqi; Zhang, Yifan; Contijoch, Francisco; McVeigh, Elliot; Ye, Xin; He, Shucheng; Haase, Robert; Pinetz, Thomas; Radbruch, Alexander; Krause, Inga; Kobler, Erich; He, Jian; Tang, Yucheng; Yang, Haichun; Huo, Yuankai; Luo, Gongning; Kushibar, Kaisar; Amankulov, Jandos; Toleshbayev, Dias; Mukhamejan, Amangeldi; Egger, Jan; Pepe, Antonio; Gsaxner, Christina; Luijten, Gijs; Fujita, Shohei; Kikuchi, Tomohiro; Wiestler, Benedikt; Kirschke, Jan S.; Rosa, Ezequiel; Bolelli, Federico; Lumetti, Luca; Grana, Costantino; Xie, Kunpeng; Wu, Guomin; Puladi, Behrus; Martín-Isla, Carlos; Lekadir, Karim; Campello, Victor M.; Shao, Wei; Brisbane, Wayne; Jiang, Hongxu; Wei, Hao; Yuan, Wu; Li, Shuangle; Zhou, Yuyin; Wang, Bo

Efficient MedSAMs: Segment Anything in Medical Images on Laptop Proceeding

2024.

Arango, Sebastian Pineda; Janowski, Maciej; Purucker, Lennart; Zela, Arber; Hutter, Frank; Grabocka, Josif

Ensembling Finetuned Language Models for Text Classification Inproceedings

In: NeurIPS 2024 Workshop on Fine-Tuning in Modern Machine Learning: Principles and Scalability, 2024.

Küken, Jaris; Purucker, Lennart; Hutter, Frank

Large Language Models Engineer Too Many Simple Features for Tabular Data Inproceedings

In: NeurIPS 2024 Third Table Representation Learning Workshop, 2024, (Oral Presentation).

Sukthanker, Rhea Sanjay; Zela, Arber; Staffler, Benedikt; Klein, Aaron; Purucker, Lennart; Franke, Joerg K. H.; Hutter, Frank

HW-GPT-Bench: Hardware-Aware Architecture Benchmark for Language Models Inproceedings

In: 38th Conference on Neural Information Processing Systems (NeurIPS), DBT Track, 2024.

Strangmann, Tobias; Purucker, Lennart; Franke, Jörg K. H.; Rapant, Ivo; Ferreira, Fabio; Hutter, Frank

Transfer Learning for Finetuning Large Language Models Inproceedings

In: NeurIPS 2024 Workshop on Adaptive Foundation Models, 2024.

Rapant, Ivo; Purucker, Lennart; Ferreira, Fabio; Arango, Sebastian Pineda; Kadra, Arlind; Grabocka, Josif; Hutter, Frank

Quick-Tune-Tool: A Practical Tool and its User Guide for Automatically Finetuning Pretrained Models Inproceedings

In: Proceedings of the Third International Conference on Automated Machine Learning (AutoML 2024), Workshop Track, 2024.

Maier, Jannis; Möller, Felix; Purucker, Lennart

Hardware Aware Ensemble Selection for Balancing Predictive Accuracy and Cost Inproceedings

In: Proceedings of the Third International Conference on Automated Machine Learning (AutoML 2024), Workshop Track, 2024.

Bergman, Eddie; Purucker, Lennart; Hutter, Frank

Don’t Waste Your Time: Early Stopping Cross-Validation Inproceedings

In: Proceedings of the Third International Conference on Automated Machine Learning (AutoML 2024), Methods Track, 2024.

Wegmeth, Lukas; Vente, Tobias; Purucker, Lennart

Revealing the Hidden Impact of Top-N Metrics on Optimization in Recommender Systems Inproceedings

In: European Conference on Information Retrieval, pp. 140–156, Springer 2024.

Bergman, Edward; Feurer, Matthias; Bahram, Aron; Balef, Amir Rezaei; Purucker, Lennart; Segel, Sarah; Lindauer, Marius; Hutter, Frank; Eggensperger, Katharina

AMLTK: A Modular AutoML Toolkit in Python Journal Article

In: Journal of Open Source Software, vol. 9, no. 100, pp. 6367, 2024.

2023

Wegmeth, Lukas; Vente, Tobias; Purucker, Lennart; Beel, Joeran

The Effect of Random Seeds for Data Splitting on Recommendation Accuracy Conference

Perspectives on the Evaluation of Recommender Systems Workshop (PERSPECTIVES 2023), co-located with the 17th ACM Conference on Recommender Systems, 2023.