A survey on evaluation of large language models

Generative AI/benchmarks 2024. 7. 30. 09:45

Chang, Y., Wang, X., Wang, J., Wu, Y., Yang, L., Zhu, K., ... & Xie, X. (2024). A survey on evaluation of large language models. ACM Transactions on Intelligent Systems and Technology, 15(3), 1-45.

'Generative AI > benchmarks' 카테고리의 다른 글

leveraging large language models for NLG Evaluation: A survey (1)	2024.01.22
A Comprehensive Overview of Large Language Models (2)	2023.12.06
Can Large Language Models Understand Real-World Complex Instructions? (0)	2023.11.30
초록) CLEAN-EVAL: Clean Evaluation on Contaminated Large Language Models (1)	2023.11.20
초록) Human Still Wins over LLM: An Empirical Study of Active Learning on Domain-Specific Annotation Tasks (0)	2023.11.20

ABOUT ME

저는 딥러닝을 모릅니다 저는 딥러닝을 모릅니다

'Generative AI > benchmarks' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'Generative AI > benchmarks' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바