11 जुलाई 2017, द्वारासुनीता दर्जी

बड़ी तस्वीर का बेहतर विवरण: स्वास्थ्य देखभाल में कॉर्पस भाषाविज्ञान

यह ब्लॉग टुकड़ा भाषा के अध्ययन में एक अपेक्षाकृत नई विधि पेश करेगा - कॉर्पस भाषाई दृष्टिकोण - और इस बारे में बात करेगा कि स्वास्थ्य देखभाल वातावरण में संचार का विश्लेषण करने में रुचि रखने वाले भाषाई शोधकर्ताओं के लिए यह कैसे उपयोगी हो सकता है। ऐसा करने के लिए, यह प्रविष्टि पूछेगी - और उत्तर - तीन प्रश्न: (i) कॉर्पस भाषाविज्ञान क्या है? (ii) कॉर्पस भाषाई विश्लेषण कैसा दिखता है? और (iii) स्वास्थ्य देखभाल अनुसंधान के लिए कॉर्पस भाषाविज्ञान क्या पेशकश कर सकता है?

कॉर्पस भाषाविज्ञान क्या है?
कॉर्पस भाषाविज्ञान विधियों का एक संग्रह है जिसमें बड़ी मात्रा में पाठ या भाषा डेटा का अध्ययन करने के लिए विशेषज्ञ कंप्यूटर प्रोग्राम का उपयोग करना शामिल है। भाषा के इस संग्रह को a . के रूप में जाना जाता हैकोष(बहुवचननिगम ) - 'बॉडी' के लिए लैटिन। कॉर्पस भाषाविद विश्लेषण करने वाले कॉर्पोरा आमतौर पर आकार में बहुत बड़े होते हैं, जो अक्सर लाखों और कभी-कभी अरबों शब्दों के होते हैं। इसलिए, कॉर्पस विधियों की अपील यह है कि वे हमें कंप्यूटर-सहायता प्राप्त विधियों का उपयोग करके डेटा की अधिक बड़ी और अधिक प्रतिनिधि मात्रा का विश्लेषण करने की अनुमति देते हैं जो उनके साथ प्रतिकृति और निष्पक्षता की एक डिग्री लाते हैं जिसे आमतौर पर विशुद्ध रूप से मैनुअल विश्लेषणात्मक के माध्यम से प्राप्त नहीं किया जा सकता है। दृष्टिकोण।

एक कॉर्पस भाषाई विश्लेषण कैसा दिखता है?
विशेषज्ञ कंप्यूटर प्रोग्राम की सहायता से (जैसेवर्डस्मिथ टूल्स,AntConc ), कॉर्पस भाषाविद अपने डेटा में सबसे प्रमुख भाषाई पैटर्न को जल्दी (और भरोसेमंद) खोज सकते हैं। एक कोष में मुख्य पैटर्न की पहचान करने के लिए एक उपयोगी तकनीक खोजशब्द है। सीधे शब्दों में कहें, कीवर्ड ऐसे शब्द हैं जो एक कॉर्पस में दूसरे की तुलना में काफी अधिक बार आते हैं। इसलिए कीवर्ड को उस कॉर्पस की विशेषता माना जा सकता है जिसका हम विश्लेषण कर रहे हैं (या अधिक सटीक रूप से, कॉर्पस जिस शैली या विविधता का प्रतिनिधित्व करता है) और डेटा में महत्वपूर्ण विषयों को फ़्लैग कर सकता है। एक उदाहरण के रूप में, नीचे दिए गए कीवर्ड इंग्लैंड में राष्ट्रीय स्वास्थ्य सेवा (एनएचएस) के बारे में रोगी प्रतिक्रिया के 40 मिलियन-शब्द कोष से उत्पन्न हुए थे।[मैं]ये खोजशब्द इस कोष की तुलना सामान्य ब्रिटिश अंग्रेजी के 10 लाख शब्दों से करते हैं।[द्वितीय]

LL . द्वारा रैंक किए गए रोगी फ़ीडबैक के संग्रह से शीर्ष 20 कीवर्ड[iii]

पदकीवर्डआवृत्तिकीनेस वैल्यू (एलएल)
1मैं985,70136990.81
2का336,12915889.81
3मेरे362,00515079.67
4कर्मचारी159,89210641.52
5नियुक्ति138,62310205.98
6शल्य चिकित्सा134,41510157.05
7उसके19,4839997.14
8वह37,5139466.19
9बहुत178,1988503.30
10पास होना331,2588051.72
1 1चिकित्सक106,7777425.61
12मुझे193,2326831.10
13दंत चिकित्सक73,4245636.02
14अभ्यास89,1945577.85
15वे253,4915165.38
16ध्यान89,4665062.46
17जीपी67,4835002.82
18डॉक्टरों66,3644628.39
19सर्विस78,6914177.62
20प्रति946,7283790.09

हालांकि ऊपर दिए गए कई कीवर्ड (शीर्ष 3 सहित) व्याकरणिक शब्द हैं जो हमें मरीजों की टिप्पणियों की सामग्री के बारे में ज्यादा नहीं बताते हैं, इस तालिका के अन्य कीवर्ड डेटा में प्रमुख विषयों के संदर्भ में अधिक खुलासा करते हैं। उदाहरण के लिए, जैसे कीवर्डकर्मचारीतथादंत चिकित्सकस्टाफ के सदस्यों के महत्व की ओर इशारा करते हुए कि मरीज प्रतिक्रिया प्रदान करते हैं, जबकि शब्द जैसेचिकित्सक,जीपीतथाडॉक्टरों विशेष रूप से डॉक्टरों पर ध्यान देने का सुझाव दें। अन्य खोजशब्द देखभाल की साइटों पर ध्यान केंद्रित करते हैं (सर्जरी, अभ्यास), नियुक्तियों (नियुक्ति), साथ ही अधिक सामान्य अवधारणाएं जैसेध्यानतथासर्विस . डेटा में प्रमुख विषयों की पहचान करने के बाद, कॉर्पस भाषाई तकनीक हमें और अधिक गुणात्मक रूप से जांच करने की अनुमति देती है कि रोगियों ने वास्तव में उन विषयों के बारे में अपनी टिप्पणियों में कैसे बात की।

इस तरह के गुणात्मक विश्लेषण में आम तौर पर डेटा में इसके साथ आने वाले शब्दों का अध्ययन करके किसी विशेष कीवर्ड या रुचि के कीवर्ड के सेट की खोज करना शामिल होता है। इन शब्दों को कोलोकेट्स के रूप में जाना जाता है। किसी कीवर्ड का उसके बारंबार होने के संदर्भ में विश्लेषण करके हम यह समझ सकते हैं कि कॉर्पस के ग्रंथों में उस शब्द के बारे में कैसे बात की जाती है। यह स्पष्ट करने के लिए कि कोलोकेशन विश्लेषण कैसा दिखता है, नीचे दी गई तालिका शीर्ष 20 शब्दों को दिखाती है जो शब्द के पहले और बाद के तीन शब्दों में सबसे अधिक बार आते हैं।नियुक्तिमरीजों की टिप्पणियों के दौरान।

के शीर्ष 20 सहयोगनियुक्ति, LL . द्वारा रैंक किया गया

पदलगानाआवृत्तिटिप्पणियों की संख्याडालूँगा
1एक74,96549,873323085.77
2प्राप्त27,09021,78480066.48
3किताब8,1346,78633985.88
4बनाना9,4677,83829910.98
5के लिये28,91322,95129714.26
6आपातकालीन4,6764,08413164.68
7व्यवस्था4,2013,51610622.48
8पाना3,8703,65410080.61
9बुक2,6472,4147669.61
10प्रति41,96930,5397409.76
1 1बुकिंग2,1802,0356671.18
12दिन5,2444,9215793.62
13अगला3,0792,8675694.95
14रद्द1,3791,1674526.40
15मेरे17,54914,0714285.79
16वही3,0812,9424135.81
17दूसरा3,1332,7943645.12
18अति आवश्यक1,5121,3913260.35
19की पेशकश की1,4981,4233094.87
20हफ्तों2,8522,7073091.29

कॉलोकेट्स की इस सूची को स्कैन करते हुए, हम यह नोट कर सकते हैं कि एक तिहाई से अधिक शब्द अपॉइंटमेंट प्राप्त करने की प्रक्रिया से संबंधित हैं (प्राप्त,किताब,बनाना,पाना,बुक,बुकिंग,की पेशकश की ) अन्य विषय जो हम नोट कर सकते हैं वे हैं आपातकालीन नियुक्तियों पर ध्यान केंद्रित करना (आपातकालीन,अति आवश्यक), अपॉइंटमेंट बुकिंग सिस्टम (व्यवस्था), रद्दीकरण (रद्द) और प्रतीक्षा समय (हफ्तों ) जबकि कोलोकेट्स इसलिए नियुक्ति-संबंधी विषयों के प्रकारों का एक स्वाद प्रदान करते हैं, जिन पर मरीज़ अपनी प्रतिक्रिया में चर्चा करते हैं, यह समझने के लिए कि वे वास्तव में इन विषयों के बारे में क्या कह रहे हैं, हमें थोड़ा गहरा खोदने और टिप्पणियों के चयन को पढ़ने की आवश्यकता है उनकी संपूर्णता में। हम इसे कॉनकॉर्डेंस लाइनों को पढ़कर और उनका विश्लेषण करके कर सकते हैं। कॉनकॉर्डेंस लाइनें किसी शब्द या वाक्यांश के सभी उदाहरणों को आसपास के पाठ के कुछ शब्दों के साथ प्रदर्शित करती हैं, इस प्रकार हमें टिप्पणियों के भीतर उपयोग के किसी भी पुनरावर्ती पैटर्न का अधिक व्यापक रूप से निरीक्षण करने की अनुमति देती है। नियुक्तियों के विषय पर अपने ध्यान को जारी रखते हुए, नीचे दी गई छह बेतरतीब ढंग से चुनी गई सहमति पंक्तियाँ वाक्यांश की हैंआपातकालीन नियुक्ति.

वाक्यांश की समरूपता पंक्तियाँआपातकालीन नियुक्ति

1 पिछले कुछ महीनों में। Lyrics meaning: और जब मैं एक की जरूरत थीआपातकालीन नियुक्तिमुझे डॉक्टर के बुलाने के लिए पूरे दिन इंतजार करना पड़ा
2 न्यूनतम सात से दस दिन। आप एक प्राप्त करने का प्रयास कर सकते हैंआपातकालीन नियुक्ति, लेकिन रिसेप्शनिस्ट द्वारा आपकी जिरह की जाती है और
3हमेशा तय करें कि आप के मानदंडों को पूरा नहीं करते हैंआपातकालीन नियुक्ति . एक विशिष्ट चिकित्सक के साथ नियुक्तियों के लिए, मैं गया हूँ
4 बहुत मददगार डॉक्टर और कर्मचारी। एक के लिए चला गयाआपातकालीन नियुक्तिऔर एक व्यस्त दिन पर एक डॉक्टर द्वारा अपेक्षाकृत जल्दी देखा गया
5 एक पखवाड़े लेता है। यदि आप एक बनाना चाहते हैंआपातकालीन नियुक्ति उनके पास कभी नहीं है। वे बुकिंग लेने का दावा करते हैं
6हास्यास्पद है, आप एक के लिए भी नहीं पा सकते हैंआपातकालीन नियुक्ति . मुझे ड्यूस्बरी में वॉक इन सेंटर का उपयोग करने के लिए कहा गया था

सहमति लाइनों के इस छोटे से नमूने से, हम आपातकालीन नियुक्तियों के बारे में टिप्पणियों में कुछ दिलचस्प रुझान देख सकते हैं। सबसे पहले, ये टिप्पणियां नकारात्मक होती हैं (छः में से पांच नकारात्मक हैं, केवल #4 सकारात्मक प्रतिक्रिया प्रदान कर रहा है)। ये नकारात्मक टिप्पणियां आपातकालीन नियुक्तियों के बारे में रोगी की चिंताओं की एक श्रृंखला की ओर इशारा करती हैं, जिसमें प्रतीक्षा समय (#1, #2, #5), रिसेप्शनिस्ट और अन्य चिकित्सा द्वारपालों (#2) द्वारा जिरह की जा रही है, आपातकालीन नियुक्ति के लिए अर्हता प्राप्त नहीं करना शामिल है। (#3), अपॉइंटमेंट की उपलब्धता में कमी (#5) और फोन पर आपातकालीन अपॉइंटमेंट बुक करने में असमर्थ होना (#6)। इसलिए, टिप्पणियों के इस छोटे से चयन से पता चलता है कि आपातकालीन नियुक्तियों के बारे में अधिकांश टिप्पणियां नकारात्मक हैं, नियुक्ति के साथ रोगी चिंता का एक प्रमुख क्षेत्र है।

स्वास्थ्य संबंधी अनुसंधान के लिए कॉर्पस भाषाविज्ञान क्या पेशकश कर सकता है?
संचार, और विशेष रूप से भाषा, उन तरीकों को प्रतिबिंबित करने और आकार देने में महत्वपूर्ण भूमिका निभाती है जिनके बारे में लोग सोचते हैं और नैदानिक ​​संदर्भों की एक श्रृंखला में स्वास्थ्य और स्वास्थ्य देखभाल का अनुभव करते हैं। स्वास्थ्य संचार में प्रारंभिक भाषाई अनुसंधान अपेक्षाकृत छोटे डेटा सेटों पर बहुत अधिक निर्भर करता है जो दानेदार, गुणात्मक विश्लेषणों के लिए अधिक उपयुक्त होते हैं, जैसे कि आमने-सामने नैदानिक ​​मुठभेड़ों या शोध साक्षात्कार से ली गई भाषा के नमूने। इस तरह के शोध पर अक्सर एक आलोचना यह थी कि प्रस्तुत निष्कर्ष सीमित डेटासेट पर आधारित थे जो कि विशेष रूप से रुचि के विशेष नैदानिक ​​​​संदर्भ के भीतर व्यापक संचार के प्रतिनिधि नहीं थे। हाल ही में, कॉर्पस भाषाई विधियों ने शोधकर्ताओं को इनमें से कुछ बाधाओं को दूर करने में मदद की है, नैदानिक ​​​​संदर्भों के व्यापक स्पेक्ट्रम में संचार का प्रतिनिधित्व करने वाले बड़ी मात्रा में डेटा का अध्ययन करके स्वास्थ्य संबंधी संचार के भाषाई चरित्र के बारे में जानने की संभावना को दर्ज करते हुए। इसके अलावा, कीवर्ड और कोलोकेशन जैसे मात्रात्मक कम्प्यूटेशनल उपायों की मदद से, भाषाविद अपने विश्लेषणों को अधिक सांख्यिकीय रूप से मजबूत साक्ष्य में आधार बनाने में सक्षम हैं, इस प्रकार उन्हें अंतर्दृष्टि प्रदान करने में सक्षम बनाता है जो साक्ष्य-आधारित अनुसंधान के मानकों को पूरा करने के करीब आते हैं जो वर्तमान में आम हैं वैज्ञानिक चिकित्सा की दुनिया में।

यद्यपि मैंने यहां रोगी प्रतिक्रिया की भाषा पर ध्यान केंद्रित किया है, शुरू की गई स्थापित तकनीकें अनुकूलनीय हैं और इन के अध्ययन के लिए लागू की गई हैं: रोगी-व्यवसायी मुठभेड़, प्रथम व्यक्ति बीमारी खाते, स्वास्थ्य और बीमारी की मीडिया रिपोर्टिंग, और ई की भाषा -स्वास्थ्य और ऑनलाइन सलाह-मांग, बस कुछ उदाहरण पेश करने के लिए। जैसा कि यहां वर्णित संक्षिप्त विश्लेषण ने उम्मीद से प्रदर्शित किया है, भाषा पर अधिक गुणात्मक, मानव-नेतृत्व वाले परिप्रेक्ष्य के साथ मात्रात्मक कॉर्पस विधियों का संयोजन किसी भी संचार संदर्भ में महत्वपूर्ण पैटर्न और समानताओं को शक्तिशाली रूप से स्पष्ट कर सकता है, अंतर्दृष्टि उत्पन्न कर सकता है जो तरीकों की हमारी समझ को समृद्ध कर सकता है। जिसमें लोग स्वास्थ्य और बीमारी के बारे में संवाद करते हैं। और यह संयोजन - कम्प्यूटेशनल विधियों और मानव-नेतृत्व वाले विश्लेषण का - ऐसे विश्लेषणों के लिए महत्वपूर्ण है। एक चेतावनी के साथ समाप्त करने के लिए: हालांकि कंप्यूटर डेटा में लगातार और सांख्यिकीय रूप से दिलचस्प पैटर्न को फ़्लैग कर सकता है, यह मानव उपयोगकर्ता पर निर्भर है कि वे इसका पता लगाएं और बताएं कि वे महत्वपूर्ण क्यों हैं।

 

डॉ गेविन ब्रुक्स
LiPP रिसर्च फेलो / बिजनेस कंसल्टेंट

[मैं]यह डेटा से उत्पन्न होता हैचेकबॉक्स से परेलैंकेस्टर यूनिवर्सिटी में ESRC सेंटर फॉर कॉर्पस अप्रोच टू सोशल साइंस (CASS) में परियोजना।

[द्वितीय]सामान्य ब्रिटिश अंग्रेजी का प्रतिनिधित्व करने के लिए प्रयुक्त कोष BE06 है (बेकर, 2009)

[iii]लॉग-लाइबिलिटी (एलएल) का उपयोग करके कीनेस को मापा गया था (डायनिंग, 1993 ) सांख्यिकीय विश्वास उपाय। कंप्यूटर द्वारा किसी कीवर्ड को एलएल स्कोर जितना अधिक दिया जाता है, शोधकर्ता को उतना ही अधिक विश्वास हो सकता है कि वह कीवर्ड सांख्यिकीय रूप से महत्वपूर्ण है।

प्रकाशित किया गया थाशोध करनाअवर्गीकृत