
11 जुलाई 2017, द्वारासुनीता दर्जी
बड़ी तस्वीर का बेहतर विवरण: स्वास्थ्य देखभाल में कॉर्पस भाषाविज्ञान
यह ब्लॉग टुकड़ा भाषा के अध्ययन में एक अपेक्षाकृत नई विधि पेश करेगा - कॉर्पस भाषाई दृष्टिकोण - और इस बारे में बात करेगा कि स्वास्थ्य देखभाल वातावरण में संचार का विश्लेषण करने में रुचि रखने वाले भाषाई शोधकर्ताओं के लिए यह कैसे उपयोगी हो सकता है। ऐसा करने के लिए, यह प्रविष्टि पूछेगी - और उत्तर - तीन प्रश्न: (i) कॉर्पस भाषाविज्ञान क्या है? (ii) कॉर्पस भाषाई विश्लेषण कैसा दिखता है? और (iii) स्वास्थ्य देखभाल अनुसंधान के लिए कॉर्पस भाषाविज्ञान क्या पेशकश कर सकता है?
कॉर्पस भाषाविज्ञान क्या है?
कॉर्पस भाषाविज्ञान विधियों का एक संग्रह है जिसमें बड़ी मात्रा में पाठ या भाषा डेटा का अध्ययन करने के लिए विशेषज्ञ कंप्यूटर प्रोग्राम का उपयोग करना शामिल है। भाषा के इस संग्रह को a . के रूप में जाना जाता हैकोष(बहुवचननिगम ) - 'बॉडी' के लिए लैटिन। कॉर्पस भाषाविद विश्लेषण करने वाले कॉर्पोरा आमतौर पर आकार में बहुत बड़े होते हैं, जो अक्सर लाखों और कभी-कभी अरबों शब्दों के होते हैं। इसलिए, कॉर्पस विधियों की अपील यह है कि वे हमें कंप्यूटर-सहायता प्राप्त विधियों का उपयोग करके डेटा की अधिक बड़ी और अधिक प्रतिनिधि मात्रा का विश्लेषण करने की अनुमति देते हैं जो उनके साथ प्रतिकृति और निष्पक्षता की एक डिग्री लाते हैं जिसे आमतौर पर विशुद्ध रूप से मैनुअल विश्लेषणात्मक के माध्यम से प्राप्त नहीं किया जा सकता है। दृष्टिकोण।
एक कॉर्पस भाषाई विश्लेषण कैसा दिखता है?
विशेषज्ञ कंप्यूटर प्रोग्राम की सहायता से (जैसेवर्डस्मिथ टूल्स,AntConc ), कॉर्पस भाषाविद अपने डेटा में सबसे प्रमुख भाषाई पैटर्न को जल्दी (और भरोसेमंद) खोज सकते हैं। एक कोष में मुख्य पैटर्न की पहचान करने के लिए एक उपयोगी तकनीक खोजशब्द है। सीधे शब्दों में कहें, कीवर्ड ऐसे शब्द हैं जो एक कॉर्पस में दूसरे की तुलना में काफी अधिक बार आते हैं। इसलिए कीवर्ड को उस कॉर्पस की विशेषता माना जा सकता है जिसका हम विश्लेषण कर रहे हैं (या अधिक सटीक रूप से, कॉर्पस जिस शैली या विविधता का प्रतिनिधित्व करता है) और डेटा में महत्वपूर्ण विषयों को फ़्लैग कर सकता है। एक उदाहरण के रूप में, नीचे दिए गए कीवर्ड इंग्लैंड में राष्ट्रीय स्वास्थ्य सेवा (एनएचएस) के बारे में रोगी प्रतिक्रिया के 40 मिलियन-शब्द कोष से उत्पन्न हुए थे।[मैं]ये खोजशब्द इस कोष की तुलना सामान्य ब्रिटिश अंग्रेजी के 10 लाख शब्दों से करते हैं।[द्वितीय]
LL . द्वारा रैंक किए गए रोगी फ़ीडबैक के संग्रह से शीर्ष 20 कीवर्ड[iii]
पद | कीवर्ड | आवृत्ति | कीनेस वैल्यू (एलएल) |
1 | मैं | 985,701 | 36990.81 |
2 | का | 336,129 | 15889.81 |
3 | मेरे | 362,005 | 15079.67 |
4 | कर्मचारी | 159,892 | 10641.52 |
5 | नियुक्ति | 138,623 | 10205.98 |
6 | शल्य चिकित्सा | 134,415 | 10157.05 |
7 | उसके | 19,483 | 9997.14 |
8 | वह | 37,513 | 9466.19 |
9 | बहुत | 178,198 | 8503.30 |
10 | पास होना | 331,258 | 8051.72 |
1 1 | चिकित्सक | 106,777 | 7425.61 |
12 | मुझे | 193,232 | 6831.10 |
13 | दंत चिकित्सक | 73,424 | 5636.02 |
14 | अभ्यास | 89,194 | 5577.85 |
15 | वे | 253,491 | 5165.38 |
16 | ध्यान | 89,466 | 5062.46 |
17 | जीपी | 67,483 | 5002.82 |
18 | डॉक्टरों | 66,364 | 4628.39 |
19 | सर्विस | 78,691 | 4177.62 |
20 | प्रति | 946,728 | 3790.09 |
हालांकि ऊपर दिए गए कई कीवर्ड (शीर्ष 3 सहित) व्याकरणिक शब्द हैं जो हमें मरीजों की टिप्पणियों की सामग्री के बारे में ज्यादा नहीं बताते हैं, इस तालिका के अन्य कीवर्ड डेटा में प्रमुख विषयों के संदर्भ में अधिक खुलासा करते हैं। उदाहरण के लिए, जैसे कीवर्डकर्मचारीतथादंत चिकित्सकस्टाफ के सदस्यों के महत्व की ओर इशारा करते हुए कि मरीज प्रतिक्रिया प्रदान करते हैं, जबकि शब्द जैसेचिकित्सक,जीपीतथाडॉक्टरों विशेष रूप से डॉक्टरों पर ध्यान देने का सुझाव दें। अन्य खोजशब्द देखभाल की साइटों पर ध्यान केंद्रित करते हैं (सर्जरी, अभ्यास), नियुक्तियों (नियुक्ति), साथ ही अधिक सामान्य अवधारणाएं जैसेध्यानतथासर्विस . डेटा में प्रमुख विषयों की पहचान करने के बाद, कॉर्पस भाषाई तकनीक हमें और अधिक गुणात्मक रूप से जांच करने की अनुमति देती है कि रोगियों ने वास्तव में उन विषयों के बारे में अपनी टिप्पणियों में कैसे बात की।
इस तरह के गुणात्मक विश्लेषण में आम तौर पर डेटा में इसके साथ आने वाले शब्दों का अध्ययन करके किसी विशेष कीवर्ड या रुचि के कीवर्ड के सेट की खोज करना शामिल होता है। इन शब्दों को कोलोकेट्स के रूप में जाना जाता है। किसी कीवर्ड का उसके बारंबार होने के संदर्भ में विश्लेषण करके हम यह समझ सकते हैं कि कॉर्पस के ग्रंथों में उस शब्द के बारे में कैसे बात की जाती है। यह स्पष्ट करने के लिए कि कोलोकेशन विश्लेषण कैसा दिखता है, नीचे दी गई तालिका शीर्ष 20 शब्दों को दिखाती है जो शब्द के पहले और बाद के तीन शब्दों में सबसे अधिक बार आते हैं।नियुक्तिमरीजों की टिप्पणियों के दौरान।
के शीर्ष 20 सहयोगनियुक्ति, LL . द्वारा रैंक किया गया
पद | लगाना | आवृत्ति | टिप्पणियों की संख्या | डालूँगा |
1 | एक | 74,965 | 49,873 | 323085.77 |
2 | प्राप्त | 27,090 | 21,784 | 80066.48 |
3 | किताब | 8,134 | 6,786 | 33985.88 |
4 | बनाना | 9,467 | 7,838 | 29910.98 |
5 | के लिये | 28,913 | 22,951 | 29714.26 |
6 | आपातकालीन | 4,676 | 4,084 | 13164.68 |
7 | व्यवस्था | 4,201 | 3,516 | 10622.48 |
8 | पाना | 3,870 | 3,654 | 10080.61 |
9 | बुक | 2,647 | 2,414 | 7669.61 |
10 | प्रति | 41,969 | 30,539 | 7409.76 |
1 1 | बुकिंग | 2,180 | 2,035 | 6671.18 |
12 | दिन | 5,244 | 4,921 | 5793.62 |
13 | अगला | 3,079 | 2,867 | 5694.95 |
14 | रद्द | 1,379 | 1,167 | 4526.40 |
15 | मेरे | 17,549 | 14,071 | 4285.79 |
16 | वही | 3,081 | 2,942 | 4135.81 |
17 | दूसरा | 3,133 | 2,794 | 3645.12 |
18 | अति आवश्यक | 1,512 | 1,391 | 3260.35 |
19 | की पेशकश की | 1,498 | 1,423 | 3094.87 |
20 | हफ्तों | 2,852 | 2,707 | 3091.29 |
कॉलोकेट्स की इस सूची को स्कैन करते हुए, हम यह नोट कर सकते हैं कि एक तिहाई से अधिक शब्द अपॉइंटमेंट प्राप्त करने की प्रक्रिया से संबंधित हैं (प्राप्त,किताब,बनाना,पाना,बुक,बुकिंग,की पेशकश की ) अन्य विषय जो हम नोट कर सकते हैं वे हैं आपातकालीन नियुक्तियों पर ध्यान केंद्रित करना (आपातकालीन,अति आवश्यक), अपॉइंटमेंट बुकिंग सिस्टम (व्यवस्था), रद्दीकरण (रद्द) और प्रतीक्षा समय (हफ्तों ) जबकि कोलोकेट्स इसलिए नियुक्ति-संबंधी विषयों के प्रकारों का एक स्वाद प्रदान करते हैं, जिन पर मरीज़ अपनी प्रतिक्रिया में चर्चा करते हैं, यह समझने के लिए कि वे वास्तव में इन विषयों के बारे में क्या कह रहे हैं, हमें थोड़ा गहरा खोदने और टिप्पणियों के चयन को पढ़ने की आवश्यकता है उनकी संपूर्णता में। हम इसे कॉनकॉर्डेंस लाइनों को पढ़कर और उनका विश्लेषण करके कर सकते हैं। कॉनकॉर्डेंस लाइनें किसी शब्द या वाक्यांश के सभी उदाहरणों को आसपास के पाठ के कुछ शब्दों के साथ प्रदर्शित करती हैं, इस प्रकार हमें टिप्पणियों के भीतर उपयोग के किसी भी पुनरावर्ती पैटर्न का अधिक व्यापक रूप से निरीक्षण करने की अनुमति देती है। नियुक्तियों के विषय पर अपने ध्यान को जारी रखते हुए, नीचे दी गई छह बेतरतीब ढंग से चुनी गई सहमति पंक्तियाँ वाक्यांश की हैंआपातकालीन नियुक्ति.
वाक्यांश की समरूपता पंक्तियाँआपातकालीन नियुक्ति
1 | पिछले कुछ महीनों में। Lyrics meaning: और जब मैं एक की जरूरत थी | आपातकालीन नियुक्ति | मुझे डॉक्टर के बुलाने के लिए पूरे दिन इंतजार करना पड़ा |
2 | न्यूनतम सात से दस दिन। आप एक प्राप्त करने का प्रयास कर सकते हैं | आपातकालीन नियुक्ति | , लेकिन रिसेप्शनिस्ट द्वारा आपकी जिरह की जाती है और |
3 | हमेशा तय करें कि आप के मानदंडों को पूरा नहीं करते हैं | आपातकालीन नियुक्ति | . एक विशिष्ट चिकित्सक के साथ नियुक्तियों के लिए, मैं गया हूँ |
4 | बहुत मददगार डॉक्टर और कर्मचारी। एक के लिए चला गया | आपातकालीन नियुक्ति | और एक व्यस्त दिन पर एक डॉक्टर द्वारा अपेक्षाकृत जल्दी देखा गया |
5 | एक पखवाड़े लेता है। यदि आप एक बनाना चाहते हैं | आपातकालीन नियुक्ति | उनके पास कभी नहीं है। वे बुकिंग लेने का दावा करते हैं |
6 | हास्यास्पद है, आप एक के लिए भी नहीं पा सकते हैं | आपातकालीन नियुक्ति | . मुझे ड्यूस्बरी में वॉक इन सेंटर का उपयोग करने के लिए कहा गया था |
सहमति लाइनों के इस छोटे से नमूने से, हम आपातकालीन नियुक्तियों के बारे में टिप्पणियों में कुछ दिलचस्प रुझान देख सकते हैं। सबसे पहले, ये टिप्पणियां नकारात्मक होती हैं (छः में से पांच नकारात्मक हैं, केवल #4 सकारात्मक प्रतिक्रिया प्रदान कर रहा है)। ये नकारात्मक टिप्पणियां आपातकालीन नियुक्तियों के बारे में रोगी की चिंताओं की एक श्रृंखला की ओर इशारा करती हैं, जिसमें प्रतीक्षा समय (#1, #2, #5), रिसेप्शनिस्ट और अन्य चिकित्सा द्वारपालों (#2) द्वारा जिरह की जा रही है, आपातकालीन नियुक्ति के लिए अर्हता प्राप्त नहीं करना शामिल है। (#3), अपॉइंटमेंट की उपलब्धता में कमी (#5) और फोन पर आपातकालीन अपॉइंटमेंट बुक करने में असमर्थ होना (#6)। इसलिए, टिप्पणियों के इस छोटे से चयन से पता चलता है कि आपातकालीन नियुक्तियों के बारे में अधिकांश टिप्पणियां नकारात्मक हैं, नियुक्ति के साथ रोगी चिंता का एक प्रमुख क्षेत्र है।
स्वास्थ्य संबंधी अनुसंधान के लिए कॉर्पस भाषाविज्ञान क्या पेशकश कर सकता है?
संचार, और विशेष रूप से भाषा, उन तरीकों को प्रतिबिंबित करने और आकार देने में महत्वपूर्ण भूमिका निभाती है जिनके बारे में लोग सोचते हैं और नैदानिक संदर्भों की एक श्रृंखला में स्वास्थ्य और स्वास्थ्य देखभाल का अनुभव करते हैं। स्वास्थ्य संचार में प्रारंभिक भाषाई अनुसंधान अपेक्षाकृत छोटे डेटा सेटों पर बहुत अधिक निर्भर करता है जो दानेदार, गुणात्मक विश्लेषणों के लिए अधिक उपयुक्त होते हैं, जैसे कि आमने-सामने नैदानिक मुठभेड़ों या शोध साक्षात्कार से ली गई भाषा के नमूने। इस तरह के शोध पर अक्सर एक आलोचना यह थी कि प्रस्तुत निष्कर्ष सीमित डेटासेट पर आधारित थे जो कि विशेष रूप से रुचि के विशेष नैदानिक संदर्भ के भीतर व्यापक संचार के प्रतिनिधि नहीं थे। हाल ही में, कॉर्पस भाषाई विधियों ने शोधकर्ताओं को इनमें से कुछ बाधाओं को दूर करने में मदद की है, नैदानिक संदर्भों के व्यापक स्पेक्ट्रम में संचार का प्रतिनिधित्व करने वाले बड़ी मात्रा में डेटा का अध्ययन करके स्वास्थ्य संबंधी संचार के भाषाई चरित्र के बारे में जानने की संभावना को दर्ज करते हुए। इसके अलावा, कीवर्ड और कोलोकेशन जैसे मात्रात्मक कम्प्यूटेशनल उपायों की मदद से, भाषाविद अपने विश्लेषणों को अधिक सांख्यिकीय रूप से मजबूत साक्ष्य में आधार बनाने में सक्षम हैं, इस प्रकार उन्हें अंतर्दृष्टि प्रदान करने में सक्षम बनाता है जो साक्ष्य-आधारित अनुसंधान के मानकों को पूरा करने के करीब आते हैं जो वर्तमान में आम हैं वैज्ञानिक चिकित्सा की दुनिया में।
यद्यपि मैंने यहां रोगी प्रतिक्रिया की भाषा पर ध्यान केंद्रित किया है, शुरू की गई स्थापित तकनीकें अनुकूलनीय हैं और इन के अध्ययन के लिए लागू की गई हैं: रोगी-व्यवसायी मुठभेड़, प्रथम व्यक्ति बीमारी खाते, स्वास्थ्य और बीमारी की मीडिया रिपोर्टिंग, और ई की भाषा -स्वास्थ्य और ऑनलाइन सलाह-मांग, बस कुछ उदाहरण पेश करने के लिए। जैसा कि यहां वर्णित संक्षिप्त विश्लेषण ने उम्मीद से प्रदर्शित किया है, भाषा पर अधिक गुणात्मक, मानव-नेतृत्व वाले परिप्रेक्ष्य के साथ मात्रात्मक कॉर्पस विधियों का संयोजन किसी भी संचार संदर्भ में महत्वपूर्ण पैटर्न और समानताओं को शक्तिशाली रूप से स्पष्ट कर सकता है, अंतर्दृष्टि उत्पन्न कर सकता है जो तरीकों की हमारी समझ को समृद्ध कर सकता है। जिसमें लोग स्वास्थ्य और बीमारी के बारे में संवाद करते हैं। और यह संयोजन - कम्प्यूटेशनल विधियों और मानव-नेतृत्व वाले विश्लेषण का - ऐसे विश्लेषणों के लिए महत्वपूर्ण है। एक चेतावनी के साथ समाप्त करने के लिए: हालांकि कंप्यूटर डेटा में लगातार और सांख्यिकीय रूप से दिलचस्प पैटर्न को फ़्लैग कर सकता है, यह मानव उपयोगकर्ता पर निर्भर है कि वे इसका पता लगाएं और बताएं कि वे महत्वपूर्ण क्यों हैं।
डॉ गेविन ब्रुक्स
LiPP रिसर्च फेलो / बिजनेस कंसल्टेंट
[मैं]यह डेटा से उत्पन्न होता हैचेकबॉक्स से परेलैंकेस्टर यूनिवर्सिटी में ESRC सेंटर फॉर कॉर्पस अप्रोच टू सोशल साइंस (CASS) में परियोजना।
[द्वितीय]सामान्य ब्रिटिश अंग्रेजी का प्रतिनिधित्व करने के लिए प्रयुक्त कोष BE06 है (बेकर, 2009)
[iii]लॉग-लाइबिलिटी (एलएल) का उपयोग करके कीनेस को मापा गया था (डायनिंग, 1993 ) सांख्यिकीय विश्वास उपाय। कंप्यूटर द्वारा किसी कीवर्ड को एलएल स्कोर जितना अधिक दिया जाता है, शोधकर्ता को उतना ही अधिक विश्वास हो सकता है कि वह कीवर्ड सांख्यिकीय रूप से महत्वपूर्ण है।
अभी तक कोई टिप्पणी नहीं, पहले बनने के लिए एक टिप्पणी भरें
उत्तर छोड़ दें