[논문리뷰] The German Commons - 154 Billion Tokens of Openly Licensed Text for German Language ModelsarXiv에 게시된 'The German Commons - 154 Billion Tokens of Openly Licensed Text for German Language Models' 논문에 대한 자세한 리뷰입니다.#Review#German Commons#Large Language Models#Training Data#Openly Licensed Text#Data Curation#German NLP#Corpus Construction#Quality Filtering2025년 10월 17일댓글 수 로딩 중
[논문리뷰] German4All - A Dataset and Model for Readability-Controlled Paraphrasing in GermanCristian-George Craciun이 arXiv에 게시한 'German4All - A Dataset and Model for Readability-Controlled Paraphrasing in German' 논문에 대한 자세한 리뷰입니다.#Review#Text Simplification#Paraphrasing#Readability Control#German NLP#Dataset Generation#LLM Distillation#Multi-level Text Generation#Accessibility2025년 8월 26일댓글 수 로딩 중