• Nem Talált Eredményt

Kapcsolódó kutatások

A lumbalis lordosis íve normális

5. Kapcsolódó kutatások

A radiológiai leletek jellemzően még mindig szabad megfogalmazású, a radioló-gus által diktált szövegek, nem pedig jól kategorizált adatgyűjtemények, így azok információtartalmának megfelelő kinyerése kihívás elé állítja a kutatókat. Általá-nosságban elmondhatjuk, hogy a jelenleg vezető kutatások az adatok kinyerésé-re valamilyen, gyakran gépi tanulással kiegészített, természetesnyelv-feldolgozó (NLP) módszert használnak. Az alkalmazások köre a kinyert információ típu-sától függően széles spektrumon változik. Többek között beszélhetünk diagnó-zissegéd [10], [11], [12], diagnosztikai minőségbiztosítást [13], [14], [15], [16], a leletek automatikus BNO kódolását végző [17], a nem várt elváltozásokra adott válaszlépéseket [18], vagy a további vizsgálatokra vonatkozó ajánlásokat figye-lő [19], illetve a páciens egészségi állapotát nyomon követő alkalmazásokról [20].

A közelmúltban több olyan összefoglaló cikk is megjelent, mely jól bemutatja az elmúlt egy évtizedben történt fontosabb előrelépéseket [21], [22], [23], [24], [25], [26].

A terület folyamatos bővülése ellenére a nemzetközi szakirodalom viszony-lag szegényesnek mondható a kifejezetten gerincröntgen leleteket, NLP és gépi tanulással feldolgozó tanulmányokat illetően. Tan és munkatársai egy szabály-alapú és egy gépi tanuláson alapuló rendszer teljesítményét hasonlították össze 26 alsóháti fájdalomra utaló orvosi megállapítás radiológiai leletekben történő felismerésében [27]. A feladatot a gépi tanulást alkalmazó rendszer 0,98, míg a szabályalapú rendszer 0,90 AUC (vevő működési karakterisztika görbe alatti te-rület) érték mellett teljesítette. A szerzők egy másik, 2018-as tanulmányukban reguláris kifejezéseket alkalmazó, szabályalapú NLP algoritmust mutattak be, mely a radiológiai leletekben az 1-es típusú Modic véglemez elváltozásokat 0,79 F1-érték mellett ismerte fel [28]. A szerzők a reguláris kifejezéseken alapuló algo-ritmus hátrányaként említik, hogy a gerincleletek szövegének változatossága mi-att nehéz minden esetet lefedő szabályrendszert kialakítani. Wang és szerzőtársai 6 általános, csontritkulásból fakadó töréstípus szabad megfogalmazású radioló-giai leletekben történő felismerésére fejlesztettek szabályalapú NLP alkalmazást,

mely elsősorban reguláris kifejezések használatával végzi az osztályozást [29]. A gerinctöréses esetek felismerésében a modell 0,91 F1-értéket mutatott. Hassan-pour és munkatársai SVM technológiával kiegészített CRF modellt fejlesztettek az orvosi szempontból releváns elváltozások radiológiai leletekben történő felis-merésére. Az alkalmazás ezen túlmenően vizsgálta az elváltozások állapotában bekövetkező változások mértékét és jelentőségét is [30]. A modell a jelentős el-változások azonosításában 0,75, míg a változás mértékének azonosításában 0,95 F1-értéket ért el. Xu és szerzőtársai gyakori szöveges mintázatok bányászatá-val (labeled sequential pattern, LSP) támogatott CRF modellt fejlesztettek a radiológiai leletekben található további vizsgálatokat javasló mondatok felisme-résére [31]. Az LSP feladata az ajánlást nagy valószínűséggel nem tartalmazó mondatok kiszűrése volt, míg a CRF az ajánlást tartalmazó mondatok azono-sítását végezte. A modell az ajánlást tartalmazó mondatok felismerésében 0,88 F1-értéket ért el.

Magyar nyelvű klinikai szövegek feldolgozásában is születtek már eredmé-nyek [32]. Például orvosi szövegek automatikus szegmentálására és az orvosi rövidítések automatikus kezelésére gépi tanuláson alapuló rendszert fejlesztet-tek [33,34]. A lelefejlesztet-tek szövegeiben gyakran előforduló elírások, elgépelések auto-matikus javítása szintén elengedhetetlen egy jól működő információkinyerő alkal-mazáshoz [35]. Az utóbbi években ezen felül megvalósult egy szemészeti klinikai keresőrendszer [36], illetve egy magyar nyelvű orvosi leletekben, releváns kifeje-zések azonosítására specializált, nem felügyelt módszereket alkalmazó rendszer is [37].

Tanulmányunk egy további lépés a magyar nyelvű szövegekből történő kli-nikai információkinyerés felé, mely egyelőre a gerincröntgen leletekben található elváltozás, tulajdonság és testrész típusú szavak detektálásra szorítkozik. Noha összahasonlítható eredmények magyar nyelvre egyelőre nem állnak rendelkezés-re, azonban a nemzetközi szakirodalomban található számszerű eredményekkel összevetve rendszerünk versenyképesnek tűnik.

6. Összegzés

Cikkünkben magyar nyelvű radiológiai leletek automatikus feldolgozásának mód-szeréről és az első kapcsolódó kísérletekről számoltunk be. Kidolgoztunk egy módszert a leletek legfontosabb elemeinek annotálására, melyet radiológus, nyel-vész és informatikus részvételével iteratívan, több körben finomítottunk. A mód-szer alapján a radiológus 250 gerinc MR lelet annotálását végezte el. Az infor-mációkinyeréshez gépi tanulást alkalmaztunk, szem előtt tartva, hogy a jövőben a gerinc MR-felvételeken kívül tágabb felhasználási területeket is meg szeret-nénk nyitni. Egy CRF tanulót alkalmaztunk, mely egy korszerű és gyakorta használt megoldás névelem-felismerésre. Az első kísérletek 87,5%-92,3% közötti F1-értékkel zárultak, melyek összemérhetőek a hasonló célokat kitűző, de angol nyelvű leleteken elvégzett kísérletekkel. A jelenlegi megoldás számos fejlesztési lehetőséget kínál, mint a nyelvi elemzés felhasználása és a mély tanulás alkalma-zása.

Köszönetnyilvánítás

A jelen cikkben közölt kutatást részben az Emberi Erőforrások Minisztériuma támogatta (20391-3/2018/FEKUSTRAT).

Hivatkozások

1. Uzuner, O., Goldstein, I., Luo, Y., Kohane, I.: Identifying Patient Smoking Status From Medical Discharge Records. Journal of the American Medical Informatics Association: JAMIA15(1) (2008) 14–24

2. Uzuner, O.: Recognizing Obesity and Comorbidities in Sparse Data. Journal of the American Medical Informatics Association16(4) (2009) 561–570

3. Orosz, Gy., Novák, A., Prószéky, G.: Lessons Learned from Tagging Clinical Hun-garian. International Journal of Computational Linguistics and Applications 5 (2014)

4. Friedman, C., Alderson, P.O., Austin, J.H.M., Cimino, J.J., Johnson, S.B.: A General Natural-language Text Processor for Clinical Radiology. Journal of the American Medical Informatics Association1(2) (1994) 161–174

5. Stenetorp, P., Pyysalo, S., Topić, G., Ohta, T., Ananiadou, S., Tsujii, J.: brat:

A Web-based Tool for NLP-Assisted Text Annotation. In: Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics, Avignon, France, Association for Computational Linguistics (2012) 102–107

6. Lafferty, J.D., McCallum, A., Pereira, F.C.N.: Conditional Random Fields: Pro-babilistic Models for Segmenting and Labeling Sequence Data. In: Proceedings of the Eighteenth International Conference on Machine Learning. ICML ’01, San Francisco, CA, USA, Morgan Kaufmann Publishers Inc. (2001) 282–289

7. Okazaki, N.: CRFsuite: A Fast Implementation of Conditional Random Fields (CRFs). http://www.chokkan.org/software/crfsuite/ (2007)

8. Honnibal, M.: spaCy: Industrial-Strength Natural Language Processing.

https://spacy.io/ (Utoljára látogatva: 2018-11-10)

9. Zsibrita, J., Vincze, V., Farkas, R.: magyarlanc: A Toolkit for Mor-phological and Dependency Parsing of Hungarian. http://rgai.inf.u-szeged.hu/index.php?lang=en&page=magyarlanc (2013)

10. Pham, A.D., Névéol, A., Lavergne, T., Yasunaga, D., Clément, O., Meyer, G., Mor-ello, R., Burgun, A.: Natural Language Processing of Radiology Reports for the Detection of Thromboembolic Diseases and Clinically Relevant Incidental Find-ings. BMC Bioinformatics15(1) (2014) 266

11. Rink, B., Roberts, K., Harabagiu, S., Scheuermann, R.H., Toomay, S., Browning, T., Bosler, T., Peshock, R.: Extracting Actionable Findings of Appendicitis from Radiology Reports Using Natural Language Processing. AMIA Joint Summits on Translational Science Proceedings. AMIA Joint Summits on Translational Science 2013(2013) 221

12. Solti, I., Cooke, C.R., Xia, F., Wurfel, M.M.: Automated Classification of Radiology Reports for Acute Lung Injury: Comparison of Keyword and Machine Learning Based Natural Language Processing Approaches. In: Proceedings - 2009 IEEE International Conference on Bioinformatics and Biomedicine Workshops, BIBMW 2009. Volume 2009., NIH Public Access (2009) 314–319

13. Raja, A.S., Ip, I.K., Prevedello, L.M., Sodickson, A.D., Farkas, C., Zane, R.D., Hanson, R., Goldhaber, S.Z., Gill, R.R., Khorasani, R.: Effect of Computerized Clinical Decision Support on the Use and Yield of CT Pulmonary Angiography in the Emergency Department. Radiology262(2) (2012) 468–474

14. Ip, I.K., Mortele, K.J., Prevedello, L.M., Khorasani, R.: Focal Cystic Pancrea-tic Lesions: Assessing Variation in Radiologists’ Management Recommendations.

Radiology259(1) (2011) 136–41

15. Sistrom, C.L., Dreyer, K.J., Dang, P.P., Weilburg, J.B., Boland, G.W., Rosenthal, D.I., Thrall, J.H.: Recommendations for Additional Imaging in Radiology Reports:

Multifactorial Analysis of 5.9 Million Examinations. Radiology253(2) (2009) 453–

16. Dang, P.A., Kalra, M.K., Blake, M.A., Schultz, T.J., Stout, M., Lemay, P.R., Fresh-61 man, D.J., Halpern, E.F., Dreyer, K.J.: Natural Language Processing Using Online Analytic Processing for Assessing Recommendations in Radiology Reports. Journal of the American College of Radiology5(3) (2008) 197–204

17. Farkas, R., Szarvas, Gy.: Eljárás radiológiai leletek automatikus BNO kódolására.

In Tanács, A., Csendes, D., eds.: V. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2007), Szeged, Szegedi Tudományegyetem Informatikai Tanszékcsoport, Szegedi Tudományegyetem Informatikai Tanszékcsoport (2007) 149–157

18. Dutta, S., Long, W.J., Brown, D.F., Reisner, A.T.: Automated Detection Us-ing Natural Language ProcessUs-ing of Radiologists Recommendations for Additional Imaging of Incidental Findings. Annals of Emergency Medicine62(2) (2013) 162–

19. Yetisgen-Yildiz, M., Gunn, M.L., Xia, F., Payne, T.H.: Automatic Identification169 of Critical Follow-Up Recommendation Sentences in Radiology Reports. AMIA ... Annual Symposium Proceedings / AMIA Symposium. AMIA Symposium2011 (2011) 1593–602

20. Cheng, L.T.E., Zheng, J., Savova, G.K., Erickson, B.J.: Discerning Tumor Status from Unstructured MRI Reports-Completeness of Information in Existing Reports and Utility of Automated Natural Language Processing. Journal of Digital Imaging 23(2) (2010) 119–132

21. Wang, Y., Wang, L., Rastegar-Mojarad, M., Moon, S., Shen, F., Afzal, N., Liu, S., Zeng, Y., Mehrabi, S., Sohn, S., Liu, H.: Clinical Information Extraction Applica-tions: A Literature Review (2018)

22. Pons, E., Braun, L.M., Hunink, M.G., Kors, J.A.: Natural Language Processing in Radiology: A Systematic Review. Radiology279(2) (2016) 329–343

23. Ford, E., Carroll, J.A., Smith, H.E., Scott, D., Cassell, J.A.: Extracting Infor-mation from the Text of Electronic Medical Records to Improve Case Detection:

A Systematic Review. Journal of the American Medical Informatics Association 23(5) (2016) 1007–1015

24. Cai, T., Giannopoulos, A.A., Yu, S., Kelil, T., Ripley, B., Kumamaru, K.K., Ry-bicki, F.J., Mitsouras, D.: Natural Language Processing Technologies in Radiology Research and Clinical Applications. RadioGraphics36(1) (2016) 176–191 25. Yim, W.w., Yetisgen, M., Harris, W.P., Kwan, S.W.: Natural Language Processing

in Oncology. JAMA Oncology2(6) (2016) 797

26. Meystre, S.M., Savova, G.K., Kipper-Schuler, K.C., Hurdle, J.F.: Extracting In-formation from Textual Documents in the Electronic Health Record: A Review of Recent Research. Yearbook of Medical Informatics (2008) 128–44

27. Tan, W.K., Hassanpour, S., Heagerty, P.J., Rundell, S.D., Suri, P., Huhdanpaa, H.T., James, K., Carrell, D.S., Langlotz, C.P., Organ, N.L., Meier, E.N., Sher-man, K.J., Kallmes, D.F., Luetmer, P.H., Griffith, B., Nerenz, D.R., Jarvik, J.G.:

Comparison of Natural Language Processing Rules-Based and Machine-Learning Systems to Identify Lumbar Spine Imaging Findings Related to Low Back Pain (2018)

28. Huhdanpaa, H.T., Tan, W.K., Rundell, S.D., Suri, P., Chokshi, F.H., Comstock, B.A., Heagerty, P.J., James, K.T., Avins, A.L., Nedeljkovic, S.S., Nerenz, D.R., Kallmes, D.F., Luetmer, P.H., Sherman, K.J., Organ, N.L., Griffith, B., Langlotz, C.P., Carrell, D., Hassanpour, S., Jarvik, J.G.: Using Natural Language Proces-sing of Free-Text Radiology Reports to Identify Type 1 Modic Endplate Changes.

Journal of Digital Imaging31(1) (2018) 84–90

29. Wang, Y., Mehrabi, S., Sohn, S., Atkinson, E., Amin, S., Liu, H.: Automatic Extraction of Major Osteoporotic Fractures from Radiology Reports using Natural Language Processing. In: Proceedings - 2018 IEEE International Conference on Healthcare Informatics Workshops, ICHI-W 2018, IEEE (2018) 64–65

30. Hassanpour, S., Bay, G., Langlotz, C.P.: Characterization of Change and Sig-nificance for Clinical Findings in Radiology Reports Through Natural Language Processing. Journal of Digital Imaging30(3) (2017) 314–322

31. Xu, Y., Tsujii, J., Chang, E.I.C.: Named Entity Recognition of Follow-Up and Time Information in 20 000 Radiology Reports. Journal of the American Medical Informatics Association19(5) (2012) 792–799

32. Siklósi, B., Novák, A.: A Magyar Beteg. In Tanács, A., Varga, V., Vincze, V., eds.:

X. Magyar Számítógépes Nyelvészeti Konferencia, Szeged, Szegedi Tudományegye-tem, Informatikai Tanszékcsoport (2014) 188–198

33. Orosz, Gy., Novák, A., Prószéky, G.: Hybrid Text Segmentation for Hungarian Clinical Records. In Castro, F., Gelbukh, A., González, M., eds.: Advances in Artificial Intelligence and Its Applications: 12th Mexican International Conference on Artificial Intelligence, MICAI 2013, Mexico City, Mexico, November 24-30, 2013, Proceedings, Part I, Berlin, Heidelberg, Springer Berlin Heidelberg, Springer Berlin Heidelberg (2013) 306–317

34. Siklósi, B., Novák, A.: Rec. et exp. aut. Abbr. mnyelv. KLIN. szöv-ben – Rövidíté-sek Automatikus Felismerése és Feloldása Magyar Nyelvű Klinikai Szövegekben. In Tanács, A., Varga, V., Vincze, V., eds.: X. Magyar Számítógépes Nyelvészeti Kon-ferencia, Szeged, Szegedi Tudományegyetem, Informatikai Tanszékcsoport (2014) 167–176

35. Siklósi, B., Orosz, Gy., Novák, A., Prószéky, G.: Automatic Structuring and Correction Suggestion System for Hungarian Clinical Records. In De Pauw, G., de Schryver, G.M., Forcada, M.L., M. Tyers, F., Waiganjo Wagacha, P., eds.: 8th SaLTMiL Workshop on Creation and Use of Basic Lexical Resources for Less-Resourced Languages, Istanbul (2012) 29–34

36. Siklósi, B., Novák, A.: Digitális Konzílium – Egy Szemészeti Klinikai Keresőrend-szer. In Tanács, A., Varga, V., Vincze, V., eds.: XII. Magyar Számítógépes Nyel-vészeti Konferencia (MSZNY 2016), Szeged, Szegedi Tudományegyetem, Szegedi Tudományegyetem (2016) 230–240

37. Siklósi, B., Novák, A.: Nem Felügyelt Módszerek Alkalmazása Releváns Kifeje-zések Azonosítására és Csoportosítására Klinikai Dokumentumokban. In Tanács, A., Varga, V., Vincze, V., eds.: XI. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2015), Szeged, Szegedi Tudományegyetem Informatikai Tanszékcsoport, Szegedi Tudományegyetem Informatikai Tanszékcsoport (2015) 237–248

Szkizofrénia azonosítása spontán beszéd temporális