हिज्जे डटकम : नेपालीमा लेख्नेहरूको लागी आवश्यक वेबसाइट

Nepali Hijje dot com

हामी नेपालीहरूले बोल्दा खेरी ह्रस्व र दीर्घ नछुट्टिने हुनाले लेख्दा खेरी कहाँ ह्रस्व र कहाँ दीर्घ लेख्ने भन्नेमा नेपालीमै पिएचडी गरेकाहरूलाई समेत गाह्रो पार्छ भने बाँकी अन्य मानिसहरू जसलाई नेपालीमा दिनदिनै लेख्नुपर्ने काम हुन्छ, उनीहरूको त कुरै गर्न परेन । 

मूलत: उनीहरूकै लागि नेपालीको हिज्जे (स्पेलिङ) मा हुने अन्यौलता समाधान गर्ने हेतुले ज्यादै उपयोगी हिज्जे डटकम भन्ने वेबसाइट सर्वसाधारणको लागि निशुल्क उपलब्ध छ (केही सुविधाको लागि भने पैसा तिर्नुपर्छ ) । 

अङ्ग्रेजीमा यस्तो सुविधा माइक्रोसफ्टले ल्याएको बीसौँ वर्ष भैसकेको छ तर नेपालमा नेपाली भाषामा यस्तो सुविधा दिएको यो सम्भवत: पहिलो वेबसाइट हो ।

आज हामी यो लेखमा हिज्जे डटकमका उपयोगीता, क्षमता, विभिन्न फिचरहरू, जन्मको कथा लगायतका कुराहरूको बारेमा चर्चा गर्नेछौँ । तपाईं यदि दिनदिनै जसो नेपालीमा लेख्नुपर्छ भने अन्त्यसम्मै पढ्नुहोला । निकै उपयोगी जानकारीहरू यसमा समावेश छन् ।

उपयोगिता

उदारहणको लागि माइक्रोसफ्ट वर्ड वा गुगल डक्समा तपाईंले लेख्दालेख्दै कुनै शब्दको हिज्जे मिलेन भने त्यो शब्दको ट्याक्क मुनि रातो लाइन आउँछ जुन देख्नासाथ हिज्जे सच्याउन सक्नुहुन्छ । अड्ग्रेजी भाषामा लेख्दा यस्तो सुविधा बीसौँ वर्षदेखि पाइए पनि नेपाली भाषामा थिएन ।

अब त्यस्तो समाधान हिज्जे डटकमले गरिदिन्छ । माइक्रोसफ्ट वर्डमा हिज्जे नमिलेको शब्दमा राइट क्लिक गर्दा मिल्न सक्ने विभिन्न शब्दहरूको विकल्पहरू दिएजस्तै हिज्जे डटकमले दिनेछ । 

यसमा तपाईंले नेपालीमा टाइप पनि गर्न सक्नुहुन्छ । विभिन्न फन्टहरूमा लेख्न र एउटा फन्टको अन्य फन्टहरूमा परिवर्तन पनि गर्न सक्नुहुन्छ । नेपाली शब्दकोशमा नेपाली शब्दहरूको अर्थ पनि खोज्न सक्नुहुन्छ । 

प्रधानमन्त्रीको पदमा आसिन मानिसहरूले समेत नेपाली भाषामा गम्भीर भूल भएको नेपालमा धेरै उदारहण छन् । त्यसकारण सार्वजनिक रूपमा आफ्नो धारणा लेखेर राख्ने जोकसैले पनि यो वेबसाइटको सदुपयोग गर्न सक्छन् । जस्तै पहिले यो कान्तिपुरले मात्रै प्रयोग गर्थ्यो, त्यो पनि शुल्क तिरेर । तर अहिले सबैको लागी निशुल्क उपलब्ध छ ।

फिचरहरू

नेपाली हिज्जे परीक्षण

माथि भनिसकियो कि यसको मूल काम नै हिज्जे सम्बन्धी हो भनेर । यसमा या त तपाईंले वेबसाइटमै गएर टाइप गर्न सक्नुहुन्छ र हिज्जे मिलेनमिलेको देख्न सकिन्छ । साथै तपाईंले यसमा पहिले नै लेखिसकिएको लेखलाई कपिपेष्ट गर्न सक्नुहुन्छ र यसले हिज्जे नमिलेका शब्दहरूलाई देखाइदिनेछ । 

यसले नेपाल प्रज्ञा प्रतिष्ठानले निकालेको र पछिल्लो पटक अपडेट गरेको नेपाली बृहत शब्दकोषलाई आधार मानेर हिज्जे मिलाउने काम गर्छ । 

नेपाली शब्दकोश

नेपाली बृहत शब्दकोशको पछिल्लो अपडेटेड संस्करणमा आधारित रहेरै यसमा शब्दहरूको अर्थ दिइएको छ । त्यसमा जसरी शब्दको अर्थ दिइएको हुन्छ, यसमा पनि त्यस्तै नै हुन्छ । अनि यसमा चाहिं कुनै शब्दको अर्थ खोजियो भने त्यो शब्दमा अन्य शब्द जोडिएर बनेका शब्दहरूको अर्थ पनि आउँछ । 

यसरी यो स्तरसम्मको परिष्कृत शैलीमा नेपाली शब्दको अर्थ दिइएको वेबसाइट नेपालमा यही नै पहिलो होला भन्ने हाम्रो निष्कर्ष छ । सायकको साह्रै उपयोगी र उत्कृष्ट फिचर नेपाली शब्दकोश पनि हो । 

फन्ट टाइपिङ र रूपान्तरण

यसमा विभिन्न फन्टहरूमा तपाईंले टाइप गर्न र एउटा फन्टलाई अर्को जुनसुकै फन्टमा रूपान्तरण पनि गर्न सक्नुहुन्छ । तपाईंको कम्प्युटरमा वा मोबाइलमा कुनै विशेष फन्ट छैन भने पनि यसमा चाहेकै फन्टमा सजिलै रूपान्तरण गर्न सकिन्छ ।

यसमा प्रिति, कान्तिपुर, प्रिसियस, गणेश, आकृति, आलेख, हिमालबी, नवजीवन लगायतका विभिन्न फन्टहरू उपलब्ध छन् । 

बोलेको कुरालाई लेखिदिने

प्राविधिक भाषामा speech-to-text भनिने बोलेको कुरालाई सफ्टवेयरले ठम्याएर सजिलै डिभाइसमा लेखिदिने सुविधा पनि यसले विकास गरिसकेको छ तर वेबसाइटमा निशुल्क उपलब्ध भने भएको छैन । 

खुशीको कुरा के भने कसैले यो सुविधा लिन चाहन्छ भने शुल्क तिरेर लिन सक्छ । कम्पनीले यो जो कसैले अहिले यो सुविधा दिन तयार भैसकेको छ । यो बनाउने कम्पनीका कर्मचारीहरूले आजकाल बोलेरै लेख्न थालिसकेका छन् । 

यदि तपाईंसँग ठूलो भोल्युमको अडियो फाइल छ र त्यसलाई लिखित रूपमा परिवर्तन गर्न चाहनुहुन्छ भने यो उपयोगी हुन्छ ।

तर यो त्रुटिरहित भने छैन । बोल्दा खेरीको स्पष्टता, ब्याकग्राउण्ड नोइज (background noise), बोलिको गति लगायतका कुराहरूमा विशेष निर्भर गर्छ । जे होस् , सालाखाला यसले ८०% जति शुध्दता दर (accuracy rate) कायम राख्छ । 

जस्तै यसले संसदमा केही शीर्ष नेताहरूले बोलेको कुरालाई लिखितमा उतार्ने प्रयास गर्दा पुष्पकमल दाहाल प्रचण्डको ९०%, केपि ओलीको ६०% र शेर बहादुर देउवाको २०% बोलीलाई शुध्द रूपमा उतार्न सफल भएको थियो । 

ओसिआर (अप्टिकल क्याराक्टर रिकग्निशन)

अङ्ग्रेजीमा ओसिआर पनि भनिने यो प्रविधिले छापिएका वा लेखिएका सामाग्रीहरूलाई स्क्यान गरेर पिडिएफमा परिणत गर्ने र कम्प्युटर लगायतका डिभाइसहरूमा डिजिटल शब्दहरूमा परिणत गरेर सम्पादन पनि गर्न मिल्ने सुविधा दिन्छ ।

यद्यपि यो सुविधा पाउन पनि तपाईंले अहिलेको लागि शुल्क तिर्नुपर्ने हुन्छ, वेबसाइटमा उपलब्ध छैन । यदि तपाईंसँग टन्नै पुराना किताब वा टाइपराइटरमा प्रिन्ट गरिएका सामाग्री वा पुराना डक्युमेन्टहरू छन् भने यसले सजिलै कम्प्युटरमा सम्पादन गर्न मिल्ने बनाइदिन्छ । यसको शुध्दता दर लगभग ९८% छ ।

हस्तलिखित सामाग्रीमा भने शुध्दता दर न्युन भएको कारणले अहिले नै यो सुविधाको सदुपयोग गर्न सकिदैन किन पनि भने प्राय:को  हातेलेखाइ फरकफरक हुन्छ र त्यही अनुसार यसको मोडललाई तालिम दिन धेरै गाह्रो छ । तर त्यसको लागि पनि कम्पनीले सोचिरहेको छ । 

क्षमता

हिज्जे डटकम विभिन्न क्षमताको मामिलामा सम्भवत: नेपालमै पहिलो र एकमात्र वेबसाइट होला । यसमा मुख्य शब्दहरू मात्रै साँढे तीन लाख छन् भने झण्डै दोब्बर बनाउने हिसाबले काम गरिरहेको छ । र २५ लाख शब्द हेर्न सक्ने गरी काम अघि बढिरहेको छ ।

यसको वाङमय (कर्पस) मात्रै छ लाख शब्दको छ भने युनिकोडबाट प्राप्त वाङमय भने ६० लाखको छ । यद्यपि यो मार्फत् भाषाको शुध्दअसुध्द चाहिं हेरिदैन । माथि भनिए झैँ नेपाली बृहत शब्दकोशमा आधारित रहेर हिज्जेको परीक्षण हुन्छ जसमा अहिले १ लाख २० हजार शब्दहरू छन् । 

एउटा ध्यान दिनुपर्ने कुरा के छ भने वाङमयका शब्दहरूमा त्रुटि पनि हुन सक्छन् तर शब्दकोशको मा चाहीँ हुँदैनन् ।

यसले अहिलेको संस्करणमा हिज्जेको परिक्षणको मामिलामा लगभग २५ लाख त्रुटीहरू फेला पार्न सक्छ र त्यसमा सुझाव दिने काम पनि गर्छ । र यो क्षमतालाई दोब्बर बनाउने लक्ष्यका साथ काम पनि सुरू भैसकेको छ । यसको समाचार स्रोत मात्रै लगभग ५० लाख छ भने १० लाख जति साहित्यका सामाग्रीहरू छन् । 

भन्नाले यति धेरै सूचना सामाग्रीहरू मार्फत् बनाइएको भाषासम्बन्धी सफ्टवेयर मोडल नेपालमा यो नै एकमात्र हो भन्ने कम्पनीको दाबी रहेको छ । 

हिज्जे डटकम कसरी जन्मियो ?

अब हामी नेपालीमा लेख्नेहरूको लागि अति उपयोगी यो हिज्जे डटकम वेबसाइट कसरी जन्मियो त भन्नेबारे थोरै चर्चा गर्छौँ । 

नेपाल ईन्जिनियरीङ कलेजमा ईन्जिनियरिङ पढ्दाताका नै विनोद रिजाल, जो हिज्जे डटकमका सिईओ पनि हुन् , को मनमा सन् २००५ तिरै NLP (Natural Language Processing) अबको आवश्यकता हो र यसमा भविष्य छ भन्ने लाग्न थालिसकेको थियो । 

कम्प्युटरमा लेखेर अन्तर्क्रिया गर्ने कि बोलेर गर्ने ? अनि एउटा भाषामा बोलेको कुरा अर्कै भाषामा बुझ्न सकिने र फरकफरक भाषामा बोल्नेहरूले एकार्काको भाषा नजाने पनि खास एआइको प्रयोग गरेर एकापसमा अन्तर्क्रिया गर्न सकिने जस्ता कुरा रिजालले सुने ।

यस्ता जिज्ञासाहरूबाट रिजाललाई एनएलपितर्फ आकर्षण जाग्न थाल्यो । उनले आफ्नो ईन्जिनियरिङ अध्ययनको क्रममा पनि अन्तिम वर्षको फाइनल प्रोजेक्ट पनि speech-to-text मै गरेका थिए । उनको मनमा एनएलपिको भूत जगाइदिने काम चाहिं कलेजकै एकजना शिक्षकले गरेका थिए ।

त्यसपछि सन् २०१२ तिर यो कम्पनीको थालनी भयो । पहिलो कुरा आफ्नो देश र समाजमा केही नयाँ काम गरेर योगदान गर्ने सपना रिजालको मनमा थियो भने अर्को कुरा चाहिं यो नयाँ काममा लागेर नेपालमा सुरूमै आफूले भाषाको यो नौलो क्षेत्रमा बजार पाउने आशा थियो ।

यसरी रिजालले एआइ, मसिन लर्निङ र एनएलपिको क्षेत्रमा आफ्नो जोखिमपूर्ण तर रोचक यात्रा अगाडी बढाए । हिज्जेको परीक्षण भन्ने यसको फिचर वेबसाइटमा आउनुभन्दा अगाबै कान्तिपुर मिडियाले प्रयोग गरिसकेको थियो सन् २०१६ देखि नै । 

त्यसपछि हिज्जे परीक्षणमा मात्रै सीमित नरहेर माथि उल्लिखित फिचरहरू पनि समावेश गर्दै वेबसाइट सन् २०२० देखि निशुल्क रूपमा सबैले प्रयोग गर्न पाउने व्यवस्था गरियो । 

टिप्पणी गर्नुहोस्

This site uses Akismet to reduce spam. Learn how your comment data is processed.