Magyar kulcsszavak vizsgálata és kinyerésük eredményeinek összevetése

– pilotkutatás

  • Dodé Réka
doi: 10.59648/filologia.2023.1-4.3


A kulcsszó- és terminuskinyerés nem új keletű kutatási téma, már ötven éve foglalkoznak vele a kutatók, azonban még mindig rejt magában kihívásokat. A nyelvi modellek új perspektívát adnak számos nyelvtechnológiai területen, így a kulcsszó- és terminuskinyerés
területén is, mivel a nyelvi modellek olyan új kulcsszavak generálására is képesek, amelyek nem, vagy csak részlegesen szerepelnek a szövegben. Amikor a szerzők kézzel adnak meg kulcsszavakat, akkor a saját háttértudásukból is merítenek, így ezek a kulcsszavak nem
feltétlenül szerepelnek a szövegben. A kézzel megadott kulcsszavakkal tehát érdemes foglalkozni, és tekinthetők a gold sztenderdnek, célnak a kulcsszókinyerő alkalmazások teszteléséhez. Kutatásunkban 30 változó doménból származó tudományos szöveget és a hozzájuk tartozó szerzői kulcsszavakat vetettünk össze a ChatGPT által, többféle promptra adott megoldásokkal. Az eredmények szerint nincs szignifikáns különbség a kvantitatív eredményekben, de amennyiben kvalitatívan elemezzük a ChatGPT megoldásait, azokat relevánsnak találjuk. A dolgozat célja, hogy a ChatGPT által adott kimeneteket kiértékeljük abból a szempontból, hogy mennyire közelítik meg a szerzők által megadott kulcsszavakat.


terminus kulcsszókinyerés kulcsszómegadás nyelvmodell ChatGPT

Hogyan kell idézni

Dodé, R. (2024). Magyar kulcsszavak vizsgálata és kinyerésük eredményeinek összevetése: – pilotkutatás. Filológia.Hu, 14(1–4), 51–64.


ChatGPT = ChatGPT.

REAL = REAL Repozitórium.

LlamaIndex = LlamaIndex.