Next
फेसबुकची खरी समस्या - भारतीय भाषा
BOI
Monday, April 16 | 06:45 AM
15 0 0
Share this story



आक्षेपार्ह मजकूर आणि चित्रे रोखण्याची झुकेरबर्गची कितीही इच्छा असली (!), तरी भारतात अनेक भाषा असल्यामुळे हे फेसबुकला अंमळ कठीणच जाईल, असे तज्ज्ञांचे मत आहे. केम्ब्रिज अॅनालिटिका या कंपनीने आठ कोटी ७० लाख वापरकर्त्यांची माहिती त्यांच्या परवानगीशिवाय मिळविली होती, हे फेसबुकने नुकतेच मान्य केले होते. या घोटाळ्याबद्दल एव्हाना बरीच चर्चा झाली आहे. त्यामुळे त्यावर फार चर्वितचर्वण करण्यात अर्थ नाही. आपल्या दृष्टीने महत्त्वाचे आहे तो फेसबुक आणि भारताचा संबंध. त्याची उकल करणारा हा लेख...
.........
पुढील वर्षी भारतात होणाऱ्या लोकसभा निवडणुकीसह अन्य अनेक निवडणुकांपूर्वी कंटेंट मॉडरेटर्स नियुक्त करण्याचे सूतोवाच फेसबुकने अलीकडेच केले आहे. यामुळे या लोकप्रिय संकेतस्थळावरून खोटी माहिती पसरविणाऱ्या लोकांवर अंकुश बसेल, असा कंपनीचा अंदाज आहे. तसेच खोट्या माहितीचा प्रसार रोखण्यासाठी ‘आर्टिफिशियल इंटेलिजन्स’चा वापर करण्याचेही फेसबुकने मान्य केले आहे. या उपायाचा जागतिक पातळीवर कदाचित काही परिणाम होईलही. परंतु मार्क झुकेरबर्ग नावाच्या तंत्रज्ञाच्या या आविष्कारापुढे भारतात एक वेगळीच समस्या उभी आहे, ती म्हणजे भारतीय भाषा.  
फेसबुकचा संस्थापक मार्क झुकेरबर्ग याची मंगळवारी अमेरिकी संसदेसमोर साक्ष झाली. ‘खोट्या बातम्या (फेक न्यूज) काढून टाकण्यासाठी आम्ही उपाय करत असून, त्यात ‘आर्टिफिशियल इंटेलिजन्स’चा समावेश आहे,’ असे त्याने त्यात सांगितले होते. त्यासाठी फेसबुकच्या कंटेंट मॉडरेशन टीममध्ये काम करणाऱ्यांची संख्या वाढवून ती २० हजार केली जाणार आहे. सध्या फेसबुककडे १५ हजार मॉडरेटर असून, ते फेसबुकवरील खोट्या बातम्यांची पडताळणी करतात.

अन् तरीही आक्षेपार्ह मजकूर आणि चित्रे रोखण्याची झुकेरबर्गची कितीही इच्छा असली (!), तरी भारतात अनेक भाषा असल्यामुळे हे फेसबुकला अंमळ कठीणच जाईल, असे तज्ज्ञांचे मत आहे. केम्ब्रिज अॅनालिटिका या कंपनीने आठ कोटी ७० लाख वापरकर्त्यांची माहिती त्यांच्या परवानगीशिवाय मिळविली होती, हे फेसबुकने नुकतेच मान्य केले होते. या घोटाळ्याबद्दल एव्हाना बरीच चर्चा झाली आहे. त्यामुळे त्यावर फार चर्वितचर्वण करण्यात अर्थ नाही. आपल्या दृष्टीने महत्त्वाचे आहे तो फेसबुक आणि भारताचा संबंध.

मुळात फेसबुकसाठी भारत हा महत्त्वाचा. गेल्या वर्षी जुलै महिन्यात फेसबुकवरील भारतीय वापरकर्त्यांची संख्या २४ कोटी १० लाख एवढी झाली. जगातील फेसबुकच्या वापरकर्त्यांची ही सर्वांत मोठी संख्या आहे. (त्यानंतरची आकडेवारी फेसबुकने अद्याप जाहीर केलेली नाही.) यातील तीन चतुर्थांश वापरकर्ते स्थानिक भाषांच्या माध्यमातून एकमेकांशी जोडलेले आहेत. अशा परिस्थितीत फेसबुकचे हुकमी अस्त्र असलेले आर्टिफिशियल इंटेलिजन्स (एआय) हे साधन निकामी ठरण्याचीच शक्यता जास्त आहे. कारण ते इंग्रजीतच उत्तमरीत्या कार्य करते.

ज्या भाषांमध्ये नॅचरल लँग्वेज प्रोसेसिंगची परंपरा असते, त्यात असे ‘एआय’चे साधन काम करते. इंग्रजीसारख्या भाषांमध्ये डिजिटल मजकुराचा प्रचंड मोठा साठा आहे. त्यामुळे त्यात ‘आर्टिफिशल इंटेलिजन्स’द्वारे भाषेचे विश्लेषण चांगल्या प्रकारे होते. भारतीय भाषांमध्ये डिजिटल मजकूर आता कुठे उभा राहत आहे. त्यामुळे फेसबुकचे एआय साधन त्याच्यावर कशी प्रक्रिया करेल, हे अद्याप स्पष्ट नाही.

‘संपूर्ण देशात एकसमान भाषा असेल तर काही हरकत नाही. परंतु भारतात अनेक भाषा आणि बोली आहेत. त्यामुळे मजकुराचे नियमन (कंटेंट मॉडरेशन) करणे फेसबुकला अवघडच ठरेल,’ असे ‘सेंटर फॉर इंटरनेट अँड सोसायटी’चे कार्यकारी संचालक सुनील अब्राहम यांचे मत आहे.

भारतात फेसबुकच्या वापरकर्त्यांपैकी बहुतांश जण स्मार्टफोनवर फेसबुकचा वापर करतात. त्यांतील जास्तीत जास्त लोक स्वतःच्या भाषांमध्ये व्यवहार करू इच्छितात. स्वभाषेत इंटरनेट वापरणाऱ्या लोकांची संख्या येत्या काळात कशी वाढत जाणार आहे, याबद्दल याच सदरात मी याआधी लिहिले होते. फेसबुक असो वा गुगल, या बलाढ्य कंपन्यांना आता काळजी आहे ती या ‘मायबोली’च्या पाईकांची.

‘प्रादेशिक भाषा आमच्यासाठी अत्यंत महत्वाच्या आहेत. ऑनलाइन वापरकर्त्यांची पुढील पिढी स्वतःच्या मूळ भाषेशी जास्त परिचित आणि आरामदायक असते,’ असे गुगलच्या उत्पादन व्यवस्थापनाचे उपाध्यक्ष सीझर सेनगुप्ता यांनी दीड वर्षांपूर्वी ‘क्वार्ट्झ’ या संकेतस्थळाला सांगितले होते.

‘लोकांनी आधी तंत्रज्ञानाची भाषा शिकून नंतर स्वतःच्या भाषेत ते तंत्रज्ञान वापरावे, याऐवजी तंत्रज्ञानालाच आम्ही लोकांची भाषा शिकवत आहोत,’ असे ‘मायक्रोसॉफ्ट इंडिया’चे मुख्य कार्यकारी अधिकारी मीतल पटेल यांनी १५ भारतीय भाषांमध्ये ई-मेलची सुविधा देण्याची घोषणा करताना फेब्रुवारी महिन्यात म्हटले होते.

‘लोकांना त्यांच्या पसंतीच्या भाषेत इंटरनेटवरील सेवा पुरविण्यात आल्या, तर या घडीला सुमारे २० कोटी लोक इंटरनेटचे वापरकर्ते होण्याची शक्यता आहे,’ असे ‘इंटरनेट अँड मोबाईल असोसिएशन ऑफ इंडिया’ (आयएएमएआय) आणि ‘केंटार-आयएमआरबी’ या संस्थांनी नुकत्याच प्रकाशित केलेल्या अहवालात म्हटले आहे. खुद्द गुगलने केपीएमजी या संस्थेसोबत भारतीय भाषांच्या संदर्भात एक अहवाल तयार केला आहे. त्यात म्हटले आहे, की येत्या चार वर्षांत मराठी, बंगाली, तमिळ व तेलुगू भाषांतील अशा भारतीय भाषांत इंटरनेट वापरणाऱ्यांचे प्रमाण ३० टक्के असेल.

अन् ‘गुगल-केपीएमजी’च्या याच अहवालात खरी मेख आहे. कारण या अहवालात असलेले एक निरीक्षण. हा अहवाल म्हणतो, की जवळजवळ ७० टक्के लोक इंग्रजी भाषेपेक्षा स्थानिक भाषेतील डिजिटल मजकूर अधिक विश्वासार्ह असल्याचे मानतात. आपल्या अवतीभवतीची अनेक उत्पादने व साहित्य आपल्या भाषेत येत असेल, तर त्यामागचे कारण हे निरीक्षण होय. ‘बीबीसी’सारखी जगप्रसिद्ध माध्यम संस्था मराठीत उगाच येत नाही... ‘बिग बॉस’सारखी मालिका विनाकारण मराठीत येत नाही किंवा टीव्हीवरील अधिकाधिक जाहिराती आपल्याला मराठीत उगाच दिसत नाहीत. हे सर्व घडण्याचा संबंध वरील ‘गुगल-केपीएमजी’च्या निरीक्षणाशी आहे. 

आपल्याला न उमजलेली बाब या कंपन्यांना उमजली आहे. म्हणूनच या दोन्ही कंपन्यांनी अशा अनेक अॅप आणि सेवांची यादी दिलेली आहे, ज्यात सध्या स्थानिक भाषांतील मजकूर अत्यंत कमी आहे. परंतु येत्या काळात तो झपाट्याने वाढणार आहे. उदाहरणार्थ, परंपरागत खरेदी करणाऱ्या लोकांपैकी ५० टक्के जणांनी भारतीय भाषांमध्ये संकेतस्थळ असल्यास ऑनलाइन खरेदी करण्याची इच्छा व्यक्त केली.

फेसबुकने २०११ साली भारतीय भाषांमध्ये इंटरफेस सादर केला. त्यानंतर एक-दोन वर्षांनी व्हॉट्सअॅप आले. ही दोन्ही माध्यमे लोकप्रिय होण्याचे एक कारण त्यांची भाषा व सुलभता हे होय. आज ही दोन्ही माध्यमे खोटी माहिती पसरविण्यासाठी ओळखली जातात (व्हॉट्सअॅप हे फेसबुकच्याच मालकीचे आहे). त्यातही ही दिशाभूल करणारी माहिती जास्त करून स्थानिक भाषांमध्येच असते. व्हॉट्सअॅप जगभरात १.३ अब्ज जण वापरतात. त्यातील एक पंचमांश म्हणजे २० कोटी जण एकट्या भारतात आहेत. या सर्व वापरकर्त्यांच्या भाषेचे विश्लेषण करून त्यातील खरे-खोटेपणा ठरविणे हे खायचे काम नाही.
यांत्रिक विश्लेषणाद्वारे खोटा मजकूर ओळखण्यासाठी ‘फेक न्यूज चॅलेंज’ नावाची एक स्पर्धा गेल्या वर्षी घेण्यात आली होती. कार्नेजी मेलॉन विद्यापीठातील डीन पोमेरलेऊ या तज्ज्ञांनी ती आयोजित करण्यास मदत केली होती. त्यांनी नंतर म्हटले होते, की खोट्या मजकुराची शहानिशा करणे हे एकट्या ‘एआय’ला शक्य नाही.

अशा परिस्थितीत आपले तांत्रिक ज्ञान फेसबुक कसे पणाला लावणार आणि भारतीय भाषांमधील आक्षेपार्ह मजकूर कसा शोधणार, हे पाहणे फेसबुकवर रेंगाळण्याएवढेच मनोरंजक ठरणार आहे. घोडामैदान जवळच आहे, पाहू काय होते ते.

– देविदास देशपांडे
ई-मेल : devidas@dididchyaduniyet.com

(लेखक मुक्त पत्रकार व अनुवादक असून, भाषा हा त्यांच्या अभ्यासाचा विषय आहे. ‘बाइट्स ऑफ इंडियावर दर सोमवारी प्रसिद्ध होणारे त्यांचे सर्व लेख https://goo.gl/wvsqQ8 या लिंकवर एकत्रितरीत्या उपलब्ध आहेत.)
 
15 0 0
Share this story

Post Your Comment
मराठी English
Your Name *
Email
 
Notify me once my comment is published
Comment *
Content limited to 1000 characters,1000 characters remaining.

Select Language
Share Link