Ciekawostki

Język polski najlepszy do pracy z AI. Wyniki amerykańskich badań mówią same za siebie

przeczytasz w 2 min.

Język polski jednym z najtrudniejszych na świecie? – Nie dla AI. Wyniki badań przeprowadzonych przez amerykańskich naukowców plasują go na pierwszym miejscu, jeśli chodzi o wydajność obszernych, kontekstowych promptów. Angielski daleko w tyle.

Język polski najlepszy do promptowania AI

Polski – jako jeden z najtrudniejszych języków świata – stanowi niebagatelne wyzwanie dla każdego, kto podejmuje się jego nauki. AI okazało się w tym kontekście wyjątkowo pojętnym uczniem. Ba, upodobało sobie właśnie naszą rodzimą mowę. Mimo stosunkowo niewielkich zasobów w języku polskim, służących do trenowania dużych modeli językowych, to właśnie on zajął bowiem pierwsze miejsce pod kątem wydajności w formułowaniu promptów o długim kontekście. 

Ranking, w którym przoduje, sformułowano na podstawie badania “One ruler to measure them all: Benchmarking multilingual long-context language models”, przeprowadzonego przez zespół naukowców z University of Maryland oraz Microsoftu. 

Badacze wykonali test porównawczy, w ramach którego sprawdzili wydajność promptowania w 26 różnych językach dla modeli: OpenAI o3-mini-high, Google Gemini 1.5 Flash, Qwen2.5 (7B i 72B), Llama 3.1 (8B), Llama 3.3 (70B) oraz DeepSeek-R1. Stosowane przez nich polecenia były przy tym wyjątkowo długie, kontekstowe (do nawet 128 tys. tokenów). Rezultat? – Zaskakujący nawet dla samych naukowców: 

Eksperymenty z otwartymi i zamkniętymi modelami LLM ujawniają rosnącą różnicę w wydajności między językami o niskich i wysokich zasobach, wraz ze wzrostem długości kontekstu z 8 tys. do 128 tys. tokenów. Co zaskakujące, język angielski nie jest językiem o najwyższej wydajności w zadaniach długiego kontekstu (zajął 6. miejsce na 26), a na szczyt listy wysuwa się język polski

– możemy przeczytać w raporcie z badania. 

Skuteczność promptowania AI w różnych językach – ranking

Kompletny ranking wydajności poszczególnych języków w kontekście obszernego promptowania AI prezentuje się następująco: 

  1. polski – 88%
  2. francuski – 87%
  3. włoski – 86%
  4. hiszpański – 85%
  5. rosyjski – 84%
  6. angielski – 83.9%
  7. ukraiński – 83.5%
  8. portugalski – 82%
  9. niemiecki – 81%
  10. holenderski – 80%
  11. norweski – 79%
  12. szwedzki – 78%
  13. duński – 77%
  14. węgierski – 76%
  15. fiński – 75%
  16. czeski – 73%
  17. japoński – 72%
  18. wietnamski – 71%
  19. perski – 70%
  20. serbski – 69%
  21. koreański – 66%
  22. hindi – 65%
  23. chiński – 62.1%
  24. tamilski – 61%
  25. swahili – 55%
  26. sesotho – 45%

Źródło: Yekyung Kim, Jenna Russell, Marzena Karpinska, Mohit Iyyer, “One ruler to measure them all: Benchmarking multilingual long-context language models”, arxiv.org, dostęp: 25.10.2025

Komentarze

1
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    FranzMauser
    0
    Czyli Mikołaj Rej miał rację i to nawet większą niż sobie zdawał. Szkoda tylko, że nasz język jest strasznie zaniedbany w Polsce.

    Witaj!

    Niedługo wyłaczymy stare logowanie.
    Logowanie będzie możliwe tylko przez 1Login.

    Połącz konto już teraz.

    Zaloguj przez 1Login