Friday, December 13, 2013

नेपाली वर्णविन्यासका सामान्य नियमहरू

माध्यमिक नेपाली व्याकारण (नेत्र एटम र कृष्ण हरि बराल) बाट
सर्वाधिकार लेखकद्वयमा सुरक्षित
व्यक्तिगत प्रयोजनको लागि टाइप गरेथिएँ अरूलाई पनि उपयोगी होला कि भनेर राखेको हूँ ।

ह्रस्व दीर्घ : (ह्रस्व - इ, उ, ु, ऋ, कृ, रु तथा दीर्घ - ई, ऊ, ू, रू)

(क) शब्दको सुरुमा ह्रस्व हुने

१. तद्भव र आगन्तुक नाम: इज्जत, इराक, किताब, घिउ, जिरी, ठिटो, छिमेक, कुकुर, सुकुल, कुर्सी, निसाफ, तिहुन, पित्तल, सिक्किम, सिन्की, हिउँ, हिसाब आदि ।
२. सबै व्युत्पन्न शब्दहरू: चिनियाँ, पिराहा, मितेरी, नुनिलो, दुधालु, बुढ्याइँ, सिँगौरी, फुलौरा, धुपौरो, सिलौटो, खुनी, भित्रिया आदि ।
३. सबै धातु/क्रियापदहरू: दि, थियो, धु, हु, किन्, मिल्, सुत्, धुत्, लिन्छ, डुल्यो, हिँड्ला, तिर्नेछ, पिँध्, कुद् आदि ।
४. सबै अव्ययहरू: तिर, हिजो, भित्र, सित, निर, मुनि, किनभने, कि, धिक्कार! आदि ।
५. उत्, उप, कु, दुर्, निस्, वि, सु, नि आदि उपसर्ग लागेका शब्दहरू : उल्लेख, उत्खनन्, उपहार, उपसचिव, कुकाठ, कुविचार, दुर्व्यवहार, दुर्मति, विशेष, विमान, सुनाम, सुलेखा, निगम, निपात आदि ।
६. सङ्ख्यावाचक शब्दहरू (बीस, तीन र तीस बाहेक): दुई, उन्नाईस, उनन्तीस, त्रिचालीस, त्रिपन्न, त्रिसट्ठी आदि ।
७. दुई अक्षरका सर्वनामहरू : तिमी, उनी, यिनी, तिनी, उहाँ आदि ।
८. तद्भव र आगन्तुक विशेषणहरू : पिरो, चिसो, दुब्लो, इमानी, खियाउटे, निर्धो, मिहिनेती, रित्तो, रिसाहा, लुरे, कुरौटे आदि ।
९. त्रि र द्वि भएका शब्दहरू : त्रिकोण, त्रिदेव, त्रिशूल, त्रिभुवन, द्विगु, द्वितीय, द्विगुण आदि ।
१०. सबै अनुकरणात्मक शब्दहरू : कुटुकुटु, लुसुक्क, मुसुक्क, भुतुक्क, किटिक्क आदि ।

(ख) शब्दको बीचमा ह्रस्व हुने

१. मूल नाम : कुकुर, मुजुर, कपुर, मानिस, इन्जिन, मङ्सिर, उत्तिस, खरिदार, दाइजो, नरिवल, भानिज, रेडियो, सिलिङ, हँसिया आदि ।
२. विशेषण : अमिलो, उभिन्डो, कलिलो, बलियो, सजिलो, सिकिस्त, हरियो, गुलियो, बाटुलो, मौखिक, पठित, अन्तिम आदि ।
३. समापक र असमापक क्रिया : पिटियो, बाहिरिनु, भित्रिनु, गरिएको, भनिने, हिँडिनु, खाइयो, गइन, जपिन्छ, मान्दिन, खाइटोपल्नु, गराइराखे, पढिरहन्छ, भनिदियो, सुतिराख, बसिन्छ आदि ।
४. अव्यय शब्द : अहिले, कहिले, निमत्त, बाहिर, मुन्तिर, झिमिक्क, झिलिक्क, रिमिक्क, हिरिक्क, अघिल्तिर, दिउँसो, उहिले, लुरुक्क आदि ।
५. अति, अघि, अभि, अनु, परि, प्रति, उपसर्ग लागेका शब्द : अतिरथी, अतिवाद, अधिकार, अधिपति, अनुभव, अनुहार, अभिवक्ता, अभिनय, परिचय, परिक्रम, प्रतिनिधि, प्रतिक्रिया आदि ।
६. इक, इका, इत, इम, इमा, इष्ठ, ता, त्व प्रत्यय लागेका शब्द : भाषिक, बौद्धिक, लेखिका, गायिका, रचित, हेलित, अग्रिम, स्वर्णिम, गरिमा, महिमा, कनिष्ठ, जागरुक, भावुक, आज्ञाकारिता, ओजस्विता, सहकारिता, स्वामित्व, स्थायित्व आदि ।
७. अन्त्यमा इया, इयाँ, इयार, इलो गासिएको शब्द : घटिया, झगडिया, चिनियाँ, सँधियार, अंशियार, दरिलो, दुधिलो आदि ।
८. पुलिङ्गबाट स्त्रीलिङ्ग बनाइएको शब्द : कमिनी, कर्किनी, पापिनी, घर्तिनी, थपिनी आदि ।

(ग) शब्दको अन्त्यमा ह्रस्व हुने

१. पुलिङ्गी नाम र नाता बुझाउने शब्द : ज्वाइँ, दाइ, नाति, पति, बाबु, गुरु, पनाति, जेठाजु, पोइ, भाइ, भिनाजु, फुपाजु, बराजु, गोरु (अपवाद : सम्धी, हात्ती, खसी, स्वामी) ।
२. उ अन्त्यमा आउने निर्जीव नाम : ठाउँ, गाउँ, हिउँ, घिउ, धनु, पिँडालु, आलु, मासु, स्याउ, केराउ, बीउ, लिस्नु आदि ।
३. अव्यय शब्द : अगाडि, अघि, मुनि, अनि, पनि, अस्ति, भोलि, खोइ, चाहिँ, चोटि, देखि, निम्ति, वरिपरि, वारि, पर्सि, पट्टि, फेरि, बर्सेनि, बाजि (लाई, हरू आदिबाहेक) ।
४. नु, आइ, आलु, याइँ, आउ, आरु, एलु प्रत्यय लागेका शब्दहरू : लेख्नु, खेल्नु, लेखाइ, पढाइ, मायालु, दयालु, मुर्ख्याइँ, फट्याइँ, घेराउ, चुनाउ, सिकारु, हटारु, घरेलु, बनेलु आदि ।
५. अन्त्यमा ति आउने सर्वनामबाट बनेका शब्द : यति, उति, कति, जति, त्यति आदि ।
६. अन्त्यमा चि, टि, णि, पि, थि, द्धि, धि, नि, षि, पि, भि, मि, रि, लि, ष्टि आउने केही तत्सम शब्दहरू : शुचि, रुचि, त्रुटि, कोटि, मणि, पाणि, कृति, कान्ति, मति, क्षति, प्रकृति, तिथि, सारथि, सिद्धि, बुद्धि, वृद्धि, विधि, निधि, अग्नि, शनि, मुनि, लिपि, यद्यपि, नामि, दुन्दुभि, सुरभि, नाभि, रश्मि, गरि, अरि, अञ्जलि, कलि, हवि, छवि, कवि, कृषि, ऋषि, सृष्टि, वृष्टि, दृष्टि, पुष्टि, तुष्टि, सन्तुष्टि आदि ।

(घ) शब्दको सुरुमा दीर्घ हुने

१. केही सङ्ख्यावाचक शब्द : तीन, बीस, तीस ।
२. संस्कृतबाट नेपालीमा आउँदा व्यञ्जन लोप भएका तद्भव शब्द : मीठो, दूध, सीप, ऊँट, मीत, चील, तीखो, तीतो पीठ, फूल, बूढो, ठूलो, पूरा आदि ।
३. केही तत्सम शब्द : ईश, कीट, क्रीडा, क्षीण, गीति, ग्रीष्म, जीव, टीका, पीडा, दीक्षा, नीति, नीर, पीयूष, बीभत्स, वीर, शीत, शीर्षक, चीत्कार, भीष्म, मीन, मीमांसा, सीता, स्वीकृति, न्यून, स्तूप, मूल्य, मूर्ख, शून्य, सूक्ष्म, सूत्र आदि ।

(ङ) शब्दको बीचमा दीर्घ हुने

१. सबै खङ्ख्यावाचक शब्द : एक्काईस, बाईस, तेईस, तेत्तीस, चालीस, पैंतालीस आदि ।
२. इच्छार्थक क्रियापदहरू : आऊन्, गरून्, जाऊन्, लेखून, भनून् ।
३. ईय, ईन, अनीय, तीय प्रत्यय लागेका शब्द: केन्द्रीय, भवदीय, स्वर्गीय, समकालीन, प्राचीन, कुलीन, नवीन, माननीय, स्मरणीय, द्वितीय, तृतीय आदि ।
४. केही तत्सम शब्द : परीक्षा, प्रतीक, अतीत, किरीट, गम्भीर, निरीह, प्रतीक्षा, प्रतीत, मनीषी, वाल्मीकि, शरीर, शिरीष, समीक्षा, समीर, कुतूहल, अनुभूति, उत्तीर्ण, चिरञ्जीवी, सपूत, सङ्गीत, समूह, अधीन, समीप आदि ।
५. करण, कृत, भवन, भूत आदि अन्त्यमा आउने शब्द : एकीकरण, औद्योगीकरण, केन्द्रीकृत, स्वीकृत, एकीकृत, समीभवन, एकीभवन, केन्द्रीभूत, द्रवीभूत आदि ।

(च) शब्दको अन्त्यमा दीर्घ हुने

१. स्त्रीलिङ्गी शब्द : आईमाई, उर्वशी, काली, किशोरी, गाई, गौरी, छोरी, जोई, दिदी, ढोई, रानी, स्वास्नी, फूपू, भाउजू, माइजू, सासू, जेठानी, पातली, सावित्री, भैंसी, बहिनी, बदिनी, दासी, तरुनी, युवती, ठिटी आदि ।
२. ई अन्त्यमा आउने निर्जीव नाम : औँठी, कैँची, खरानी, खोपी, गाग्री, मिठाई, सारी, धोती, पानी, फर्सी, टोपी, थाली, डाली, बाल्टी, पगरी आदि ।
३. जाति, पेसा, थर बुझाउने शब्दहरू :
(क) जाति: कामी, दमाई, सार्की, घर्ती, ज्यापू, किराँती, लिम्बू, राई, माझी, छेत्री आदि ।
(ख) पेसा : ज्यामी, डकर्मी, पादरी, प्रहरी, माली, विद्यार्थी, व्यापारी, पुजारी, सिकर्मी, आदि ।
(ग) थर : अधिकारी, सुवेदी, उप्रेती, रेग्मी, लोहनी, पुरी, प्रसाईं, भट्टराई, गरागाईं, त्रिपाठी आदि ।
४. सबै सर्वनाम शब्द : यी, ती, तिमी, तपाईं, आफू, तिनी, यिनी, ऊ, हामी आदि ।
५. सबै सङ्ख्यावाचक शब्द : दुई, साठी, असी, सत्तरी, बैसट्ठी, एकासी आदि ।
६. सबै क्रियापदहरू : जानू, भन्नू, हेर्नू, गई, लेखी, दिई, पाई, सुनी आदि ।
७. ही, री, ती, ई, अरी, तरी मा टुङ्गिने शब्द : केही, सोही, काहीँ, यसरी, कसरी, यस्तरी, उस्तरी, कस्तरी, सरासरी आदि (अपवाद : चाहिँ)
८. एर अर्थ दिने कृदन्त अव्यय : लेखी, भनी, सुनी, गई, तिरी, बनी आदि ।
९. विशेषण शब्द : चालू, लागू, अल्छी, इलमी, उपकारी, तन्नेरी, दुःखी, धनी, बुद्धू, रोगी, ज्ञानी, घाँसी, दानी, त्यागी, गफाडी, नेपाली, गोर्खाली, दङाली आदि ।
१०. भाषा, ठाउँ, नदी बुझाउने नाम: अङ्ग्रेजी, जापानी, मैथिली, हिन्दी, इटालेली, कास्की, कैलाली, ठिमी, सप्तरी, कर्णाली, राप्ती, बंबई, सेती, गण्डकी आदि ।
११. स्नेहवाची नाम : बाबू, नानू, सानू, कान्छू, कालू आदि ।
१२. विशेषणबाट बनेका भाववाची नाम : गरिबी, अमिरी, इमानदारी, नोकरी, चाकरी, जवानी, बोली, चोरी आदि ।
१३. अन्त्यमा मती, वती, वी आएका तत्सम शब्द : अमरावती, रूपवती, श्रीमती, सौभाग्यवती, ओजस्वी, तपस्वी, तेजस्वी, मायावी, मेधवी आदि ।

ब, व र ओ को प्रयोग

(क) ब को प्रयोग हुने

१. ब उच्चारण हुने सबै तद्भव र आगन्तुक शब्दमा ब को प्रयोग हुन्छ : अखबार, कबुलियत, बकुल्लो, बतास, बँदेल, बगैँचा, बैँस, बोक्रो, बन्दी, बख्खु, बखत, बापत, बकस, बाकस, बाबा, बन्दुक, सुब्बा, बन्द, जाबो आदि ।
२. ब उच्चारण हुने सबै धातु र क्रियापदमा ब लेखिन्छ : बन्, बक्, बच्, बढ्, बित्, बिर्स, बेहोर्, बन्यो, बग्छ, बच्ला, बितेछ, बिर्सन्छन्, बढेथ्यो आदि ।
३. केही अव्यय शब्द : अब, कब, जब, तब, बित्तिकै, बिस्तारै, बेग्लै, बेसरी, ब्यारे आदि ।
४. बे, बद, बि उपसर्ग लागेका शब्द : बेकाम, बेनाम, बेवारिस, बेकार, बदनाम, बदमास, बदनियत, बिकाम, बिखर्ची आदि ।
५. म् पछि ब को प्रयोग हुन्छ : चुम्बक, चुम्बन, सम्बन्ध, कुटुम्ब, अम्बर, सम्बोधन, अम्बा आदि ।
६. केही तत्सम शब्द : कुबेर, निबन्ध, बध, बद्ध, बन्धु, बाल, बाहु, ब्रहृम, ब्रह्माण्ड, बृहत्, बृहस्पति, शब्द, स्तब्ध, बहु आदि ।

(ख) 'व' को प्रयोग हुने

१. नेपालीमा व उच्चारण हुने शब्दहरूमा व नै लेखिन्छ : वर, वरिपरि, वारि, वल्लो, वहाँ, कछुवा, कुवा, चिरुवा, निबुवा, बिरुवा, भुवा, रुवा, हरूवा, क्वाप्लाक्क, क्वार्र, ट्वाक्क, ल्वाम्म, प्वाक्क, ह्वास्स, आवास, वारेसनामा, वापस, वकिल, ढेवा आदि ।
२. वान्, वत्, वती, विद् मा टुङ्गिने शब्दमा : गुणवान्, धनवान्, बलवान्, पुत्रवत्, आत्मवत्, पुत्रवती, सौभाग्यवती, भगवती, प्राणीविद्, विज्ञानविद् आदि ।
३. व्य आएका शब्दमा : अव्यय, व्यवहार, गन्तव्य, द्रष्टव्य, व्यापक, व्यग्र, व्यापार, काव्य, व्याख्या, व्याप्ति आदि ।
४. आवट, उवा, वाला, वार, वारी प्रत्यय लागेका शब्द : सजावट, बनावट, लेखुवा, झिकुवा, घरवाला, खेतवाला, जिम्मेवारी, उम्मेद्वार आदि ।
५. सम् उपसर्गपछि व लेखिन्छ : संविधान, संवाद, संवेदना, संवरण, संवत्सर आदि ।
६. ब उच्चरण भए पनि व लेखिने केही तत्सम शब्द : अनुभव, कवि, गर्व, जीवन, दानव, देवता, पर्व, प्रवाह, भावना, मानव, वचन, वर्ण, वर्णन, वायु, वसन्त, वाक्य, वातावरण, विश्वविद्यालय, वाणी, वाद, वानर, वाहान, विभिन्न, विशाल, वैदिक, विभेद, वैश्य, व्रत, वृक्ष, शिव, वैद्य, वास्तविक, विशेष आदि ।

(ग) ओ को प्रयोग

१. तद्भव र आगन्तुक शब्द : ओटा, ओखर, ओखती, ओठ, ओभरसियर, ओरालो, ओहदा, ओइरो, ओथारो, ओदान, ओझेल, ओतप्रोत, ओडार आदि ।
२. क्रियापदमा : खाओ, जाओ, बनाओस्, ओकल्नु, ओगट्यो, ओढ्छ, ओतिन्छ, ओराल, ओर्लनु, ओसार्यो आदि ।

'ए', 'य', 'ये' को प्रयोग

(क) ए को प्रयोग हुने

१. एकबाट बनेका शब्द : एक, एघार, एक्काईस, एकतीस, एकचालीस, एकाइ, एउटा, एकाङ्की, एक्लो, एकान्त, एकासी आदि ।
२. इच्छार्थक क्रियापद : गएस्, खाए, खाएस्, धोएस्, भएस् आदि ।
३. भूतकालका क्रियापदमा : गए, खाएनन्, दिएनौ, भएँ, नुहाएँ, आएन, पाएछ, धोएथ्यो, पिएन, दिएछ आदि ।
४. एर, एको प्रत्यय लागेको कृदन्त शब्द : गएको, भएर, दिएको, भएको, पिएर आदि ।

(ख) य को प्रयोग

१. यो, त्यो सर्वनाम र तिनबाट बनेका शब्द : यो, त्यो, यति, त्यति, यस्तो, त्यस्तो, यहाँ, यस, त्यहाँ, त्यस, यही, त्यही, त्यस, यहीँ, त्यहाँ, यसरी, त्यसरी, यतिन्जेल, त्यतिन्जेल आदि ।
२. भूतकालको क्रियापदमा : भयौ, भयो, खायो, खायौ, भन्यौ, थियौँ, जान्यो, आदि ।
३. व्यत्पन्न शब्दमा : कमैया, जहानियाँ, चिनियाँ, सहरिया, गवैया, रत्यौली, दुस्ट्याइँ, हँस्यौली, भरिया, करिया आदि ।
४. केही आगन्तुक शब्दमा : यकिन, सायद, पायल, डायरी, यहुदी, घायल, डायल, खयर, एयर, टायम, कायल, टायर, सायरी आदि ।
५. केही तत्सम शब्द : अन्यायी, अनुयायी, स्थायी, सुखदायी, दृश्य, पद्य, गद्य, जय, मूल्य, पूज्य, मनुष्य, यक्ष, वाणिज्य, दैत्य, यमक, यन्त्र, स्थायित्व, रचियता, यश, गायिका, नायिका आदि ।

(ग) ये को प्रयोग

१. केही शब्दमा मात्र : अन्येष्टि, ज्येष्ठ, ध्येय, प्रत्येक, मध्ये आदि ।

ऋ र रि को प्रयोग

१. तत्सम शब्दमा मात्र ऋ को प्रयोग हुन्छ : ऋग्वेद, ऋचा, ऋजु, ऋण, ऋतु, ऋषभ, ऋषि, कृत, कृतज्ञ, कृति, कृत्रिम, कृपा, कृषक, गृह, घृणा, तृतीय, तृप्ति, दृढ, दृश्य, पृथक्, बृहत्, भृकुटी, मृत, वक्तृत्व, वृद्धि, वृश्चिक, शृङ्खला, सृष्टि, समृद्धि, हृदय, मृदुल, शृङ्गार आदि ।
२. तद्भव र आगन्तुक शब्दमा रि को मात्र प्रयोग गरिन्छ : रिस, रित्तो, रिकापी, रिङ, रिपोर्ट, रिक्सा, रिबन, सिरिङ्ग, रिङटा, रिल आदि ।

क्ष/क्षे/क्ष्य, छ्या/छे को प्रयोग

१. क्ष, क्षे, क्ष्य को प्रयोग तत्सम शब्दमा मात्र हुन्छ : अक्ष, अक्षता, अक्षर, अध्यक्ष, आक्षेप, कक्ष, क्षमता, क्षय, क्षितिज, दक्ष, पक्ष, तक्षक, निक्षेप, प्रत्यक्ष, परीक्षण, राक्षस, रुक्ष, भक्षण, भिक्षुक, सर्वेक्षण, भिक्षा, लक्षण, लक्ष्मण, विक्षेप, शिक्षा, सङ्क्षेप, समक्ष, साक्षात्, साक्षी, क्षेत्र, क्षेप्यास्त्र, क्षेम, क्षत्रिय, क्षेपक, लक्ष्य, उपलक्ष्य, क्षण, क्षत, क्षत्री, क्षमा, क्षर, परिप्रेक्ष्य, भक्ष्य, रक्ष्य, आरक्ष्य आदि ।
२. छ्, छ्या, छे को प्रयोग तद्भव र आगन्तुक शब्दमा हुन्छ : छेत्री, अच्छेता, छिन, छेक, छेउ, छेस्किनी, छेपारो, छेलो, छ्या, छ्याङ, छ्यापछ्याप्ती, रछ्यान, बिछ्यौना, छल, इच्छा आदि ।
छे, छ, तत्सम शब्दमा पनि प्रयोग हुन्छन् तर छ्य प्रयोग हुदैन ।

श (तालव्य), ष(मूर्धन्य), स (दन्त्य/पातलो)

(क) श को प्रयोग हुने अवस्था

१. विसर्गभन्दा पहिले श प्रयोग हुन्छ : क्रमश:, अक्षरश:, प्रायश:, शतश:, शब्दश: आदि ।
२. ऋ, च, र, ल वर्णभन्दा अगाडि श प्रयोग गरिन्छ : पश्चात्, पश्चिम, शृङ्गार, शृङ्खला, निश्चय, आश्चर्य, विश्राम, अश्रु, श्लेष, श्लिष्ट आदि
३. श भन्दा अगाडि श को प्रयोग हुन्छ : शिशिर, शिशु, शशी, शाश्वत, शैशव, शुश्रुषा आदि (अपवाद सु उपसर्ग भएमा)
४. स र ष भन्दा अगाडि श को प्रयोग हुन्छ : आशिष्, प्रशंसा, आश्वस्त, श्वास, विशेष, विशिष्ट, नृशंस, प्रशाशक, शासन, शास्त्र, शोषक, विश्लेषण, शेष आदि ।
५. श प्रयोग हुने केही तत्सम शब्दहरू : शकुनि, शक्ति, शब्द, शरण, शास्त्र, शुचि, शैक्षिक, शैली, शोक, श्मशान, श्रुति, श्वास, श्वेत, अशक्त, आशीर्वाद, पाश्चात्य, प्रशाखा, विश्व, संशोधन, स्पृश्य, अंश, आक्रोश, आवेश, गणेश, दिशा, यश, प्रकाश, विमर्श, सदृश्य, स्पर्श आदि ।

(ख) ष को प्रयोग हुने अवस्था

१. स्वरवर्णको लगत्तै पछाडि ष् प्रयोग हुन्छ : अष्ट, आषाढ, दुष्ट, रुष्ट, सन्तुष्ट, उष्ण, उष्म, उषा, ऋषभ, ऋषि, ओष्ठ, औषधि आदि ।
२. षट् जोडिएर बनेका शब्द : षट्कोण, षट्चक्र, षडानन्, षड्गुण, षड्दर्शन आदि ।
३. क, ट, ठ, ड, ण का अघिल्तिर ष प्रयोग हुन्छ: कृषक, कृष्ण, तृष्णा, दृष्टान्त, ओष्ठ्य, कनिष्ठ, अनुष्ठान, घनिष्ठ, पाषाण, विशेषण, षोडशी, निष्कण्टक, निष्क्रिय, पुष्कर, शुष्क, मस्तिष्क आदि ।
४. ष प्रयोग हुने अन्य केही तत्सम शब्द : अभिषेक, ईर्ष्या, कोष, ग्रीष्म, निमेष, पौष, विषम, महिष, विषाद, हर्ष, निष्फल, भीष्म, मेष, भूषण, वर्षा आदि ।

(ग) स को प्रयोग हुने अवस्था

१. नेपाली तद्भव र आगन्तुक शब्दमा स मात्र प्रयोग हुन्छ : आँसु, सहर, दस, पुस, मङ्सिर, साग, सिँगार, तिर्सना, कोसिस, फेसन, लास, सास, खास, बदमास, सहिद, सायद, सैतान, स्टेसन, सिकार, सान, सनाई, सेतो, ससुरा, सिन्की, सुगा, स्कुल, सिङ, मुसो, असोज, बादसाह आदि ।
२. स, सत्, सह, सु, सम् उपसर्ग लागेका शब्दहरूमा स प्रयोग हुन्छ : सजाति, सपरिवार, सकल, सबल, सत्कर्म, सद्भाव, साकार, सदिच्छा, सहभाव, सहभागी, सहयोग, सहचारी, सुकर्म, सुश्री, सुशील, सुशोभित, सुषुप्त, सुरक्षा, सम्बन्ध, संवाद, संवत्, संवेदना, सम्बोधन आदि ।
३. अगाडि स्व, स्वयम् आउने शब्दमा : स्वकिय, स्वचालित, स्वच्छन्द, स्वतन्त्र, स्वयम्भू, स्वयंवर, स्वयम् आदि ।
४. स प्रयोग हुने केही तत्सम शब्दहरू : दास, पुरस्कार, भस्म, भास्कर, रहस्य, विस्फोट, सदन, सलिल, साधु, स्थल, स्नान, स्फुरण, स्मारक, स्वभाव, स्वर्ग, हास्य, पुस्तक, स्तुति, सुत आदि ।

ग्या/ग्यँ र ज्ञ को प्रयोग

१. ज्ञ को प्रयोग तत्सम शब्दमा मात्र गरिन्छ : अज्ञान, ज्ञान, विज्ञप्ति, ज्ञापक, जिज्ञासा, प्रतिक्षा, यज्ञ, युवराज्ञी, विज्ञ, विज्ञान, विज्ञापन, संज्ञा, सम्राज्ञी, ज्ञात आदि ।
२. ग्यँ/ग्या को प्रयोग आगन्तुक र तद्भव शब्दमा गरिन्छ : ग्याँचे, ग्याँक्क, ग्यारेन्टी, ग्याटिस, ग्यास्टिक, ग्याङ, ग्यालग्याल आदि ।

हलन्त (खुट्टो काटिने) र अजन्त (खुट्टा नकाटिने) को प्रयोग

व्यञ्जन वर्णलाई हल् भनिने हुँदा व्यञ्जनमा अन्त्य भएको शब्दलाई हलन्त भनिन्छ । शब्दका अन्त्यमा स्वर नभएको वर्णको खुट्टो काटिन्छ । अच् भनेको स्वर हो र अन्त्यमा खुट्टो नकाटिएको शब्दलाई अजन्त भनिन्छ ।

(क) हलन्त (खुट्टो काटिने) को प्रयोग हुने स्थान

१. हलन्त उच्चारण गरिने क्रियापदमा : पढ्, लेख्छन्, भन्, हेरेस्, लेखून्, जान्छन्, गएस्, गरिन्, हेर्थिस्, गरोस, होलान, गर्छेस् आदि ।
२. केही अव्यय शब्द : इस्, उफ्, क्याबात्, स्याबास्, झन्, धत्, हट्, आदि ।
३. वान्, मान्, वत्, अन्त्यमा आउने तत्सम शब्द : गुणवान्, धनवान्, बलवान्, श्रीमान्, पुत्रवत्, दण्डवत्, मित्रवत्, विद्वत्, संवत्, भगवान्, विद्वान्, हनुमान् आदि ।
४. केही अन्य तत्सम शब्द : अकस्मात्, आपद्, जगत्, वलात्, भविष्यत्, विद्युत्, शरद्, हठात्, अनुष्टुप्, आशिष्, दिक्, पृथक्, विराट्, सम्राट्, बृहत्, यावत्, संसद्, स्वागतम्, अहम्, शुभम्, स्वागतम् आदि ।

(ख) अजन्त (खुट्टो नकाटिने) अवस्था

१. नाम, सर्वनाम, विशेषण र अव्यय शब्दको उच्चारण गर्दा अन्त्यमा हलन्त भए पनि लेखाइमा खुट्टो काटिँदैन : भात, झ्याल, उसको, असल, काम, गरिब, चरन, जापान, बजार, मौसुफ, हजुर, रिस, सहित, हिमाल, नेपाल, घर, चौपट, कठोर आदि ।
२. कतिपय अनुकरणात्मक शब्दको उच्चारण गर्दा हलन्त भए पनि खुट्टो काटिँदैन : झलमल, गनगन, पटपट, दनदन, सकसक, खलखल, सरसर, बरबर, कलकल, खुसखुस आदि ।

चन्द्रबिन्दु र शिरबिन्दुको प्रयोग

चन्द्रबिन्दु (ँ) ले नाकेध्वनिलाई बुझाउँछ भने शिरबिन्दु (ं)ले पञ्चम वर्ण (ङ्, ञ्, ण्, न्, म्) लाई बुझाउँछ ।

(क) चन्द्रबिन्दुको प्रयोग हुने अवस्था

१. चन्द्रबिन्दु प्रयोग हुने केही शब्दहरू : अँध्यारो, आँप, आँसु, गँगटो, घाँटी, घुँडो, घाँडो, जुँगा, टाँक, ठाँट, तुवाँलो, ध्वाँसो, फाँसी, बाँस, भुँडी, सुँगुर, नयाँ, दायाँ, बायाँ, मैयाँ, उहाँ, कहाँ, उहीँ, जहाँ, यहाँ, वहाँ, उहाँ, घाँस, तँ, चँदुवा, गाँस, अँजुली, बियाँ, चाँचरी, जाँच, स्वाँर आदि ।
२. प्रथम पुरुषको क्रियापदमा : छौँ, गएँ, भयौँ, थिएँ, जाउँला, भनौँला, लेख्थेँ, हार्यौँ आदि ।
३. धातुसँग द/दा/दै जोडिएकोमा : देखिँदा, जाँदै, सुनाउँछ, पाउँदा हुँदै, सकिँदैन, छोडिँदै आदि ।
४. दुईओटा स्वरमा अन्त्य हुने धातुमा थ् वा छ का रूपहरू जोडिएकोमा : आउँछ, देखाउँथ्यो, पाउँछन्, हराउँथे, गाउँछौँ, लेखाउँथी आदि ।

(ख) शिरबिन्दुको प्रयोग हुने अवस्था

१. तत्सम शब्दमा य, र, ल, व, श, स, ष, ह, ज्ञ वर्णभन्दा अगाडि पञ्चम वर्णका लागि शिरबिन्दु प्रयोग गरिन्छ : संयोग, संयोजन, संयम, संरचना, संरक्षण, संलग्न, संवाद, संवेदना, संशय, अंश, अपभ्रंश, संसार, अंशु, संवत्सर, संवत्, संसर्ग, संहार, संज्ञा, संज्ञान आदि ।
२. माथिका बाहेक अन्य वर्णका अघिल्तिर, तत्सम शब्दमा पञ्चम वर्णको प्रयोग गरिन्छ :
क, ख, ग, घ भन्दा अगाडि ङ् को प्रयोग हुन्छ : अङ्क, शङ्क, सङ्गत, अङ्ग, सङ्घ ।
च, छ, ज, झ भन्दा अगाडि ञ् को प्रयोग हुन्छ : पञ्चायत, सञ्चय, लाञ्छना, सञ्जय, पुञ्ज, झञ्झा आदि ।
ट, ठ, ड, ढ भन्दा अगाडि ण् को प्रयोग हुन्छ : कण्टक, घण्टा, कण्ठ, पण्डित, चण्डी, शण्ढ आदि ।
त, थ, द, ध का अगाडि न् को प्रयोग हुन्छ : सन्त, पन्थ, मन्द, गन्ध आदि ।
प, फ, ब, भ का अगाडि म् को प्रयोग हुन्छ : कम्प, पम्फा, सम्बन्ध, अम्बा, शम्भु आदि ।
नेपाली तद्भव र आगन्तुक शब्दमा भने उच्चारण अनुसारकै पञ्चम वर्ण प्रयोग गरिन्छ, शिरबिन्दुको प्रयोग गरिदैन : भन्छ, पन्चर, फन्को, दुम्जा, बम्कनु, रुम्जा, चम्चा, झन्झट, झन्डा, गुन्डा, अन्डा, डन्डा, मन्जुर, लन्डन, सन्काहा, ब्यान्ड, रम्घा, सन्जोग आदि ।

पदयोग र पदवियोग

पदयोगको परिचय

पदयोग भनेको शब्दहरूलाई जोडेर लेख्नु हो भने पदवियोग भनेको शब्दहरूलाई छुट्याएर लेख्नु हो ।

(क) पदयोग हुने अवस्था

१. विभक्ति, उपसर्ग, प्रत्यय, नामयोगी शब्दहरू जोडिएर लेखिन्छन् : रामले, तिमीलाई, घरमा, स्कुलबाट, सहकुलपति, अनुसार, बदनाम, लेखहरू, किनुन्जेल, बोलक्कड, त्यहाँभित्र, चौरसँग, आमाबिना, बायाँपट्टि, सुशीलभन्दा, बिनाकाम आदि ।
२. समास भएर बनेका शब्दहरू जोडिएर लेखिन्छन् : पूजासामाग्री, आमाछोरी, माछापुच्छ्रे, घण्टाघर, चरीनङ्गे आदि ।
३. द्वित्व भएर बनेका शब्दहरू जोडिएर लेखिन्छन् : घरघर, गर्ल्यामगुर्लुम, बल्लबल्ल, सरसर, झैझगडा, आलोपालो, ऐँचोपैँचो आदि ।
४. संयुक्त क्रियाहरू जोडिएर लेखिन्छन् : खानुपर्थ्यो, गइसक्नुभएछ, पढिसकी, धोइदियो, गरिदिइहाल्नुपर्छ, हिँडिसक्नुभयो, लेखिदिउँला आदि ।
५. अकरण बुझाउने न जोडिएर लेखिन्छन् : नहेर, जाँदिनँ, हेर्दैनथ्यो, गएन, नखालान्, गइनछिन् ।
६. केही अव्ययहरू जोडिएर लेखिन्छन् : किनभने, किनकि, तापनि, यसकारण, हुनत आदि ।

(ख) पदवियोग हुने अवस्था

१. वाक्यमा प्रत्येक शब्दहरू छुट्टाछुट्टै लेखिन्छन् : हामी बजार गएर छाता ओढी छिटै फर्क्यौं ।
२. विभक्तिभन्दा पछि आएको विभक्ति वा नामयोगी नजोडिई लेखिन्छन् : रामका लागि, सुमनका निम्ति, हरिका मा, त्यसदेखि पर, उसले भन्दा, कोठाका पछिल्तिर आदि ।
३. निपातहरू छुट्टै लेखिन्छन् : हिजो त श्यामको भाइ पो बिरामी परेछ रे ! तिमी नै गए है ।
४. विभाजक न आएमा छुट्टै लेखिन्छन् : न यता न उता, न आयो न खबर गर्यो, न राम न लक्ष्मण आदि ।
५. संयुक्त क्रियाका बीचमा निपात आएमा क्रिया छुट्टै लेखिन्छन् : जानु नै पर्छ, भन्नु त पर्ने नै हो, कुट्नु त भएन आदि ।
६. क्रियापदले अपूर्ण र पूर्ण पक्ष जनाउँदा छुट्टै लेखिन्छन् : जाँदै छ, भनेको हुनेछ, लेख्दै छन्, पढेकी थिइन् आदि ।


माध्यमिक नेपाली व्याकारण (नेत्र एटम र कृष्ण हरि बराल) बाट
सर्वाधिकार लेखकद्वयमा सुरक्षित
(अनुमति कसलाई माग्ने भनेर थाहा नभएकोले सोध्दै नसोधी यहाँ हालेको हूँ, लेखक प्रकाशकलाई आपत्ति भएमा भन्नु होला म हटाउने छु)

Sunday, December 1, 2013

Preeti to Unicode converter

In many Nepali news sites that use unicode, one can see several strange non devanagiri characters and some errors that look like result of typos. My understanding is that they type in TTF fonts like Preeti, Kantipur later converting into unicode using one of the many unicode converters available and those errors are due to the converters. I have made a converter which takes care of these issues.

Try it here.



I looked into source code and most of them have convoluted if statements making it hard to extend and test. Errors can be attributed to these causes
  • incomplete mapping of characters 
  • converters dont take into consideration variation in typing ie ordering of shirbindu, chandara bindu and halanta 
  • these converters are available for Preeti and text typed in other fonts need to be treated slightly differently. 
This converter nep-ttf2utf an open source software which looks to solve these problems. It began as a port of foss-np's 2utf8 into python and javascript. It features
  • Supports Kantipur, Preeti, PCS Nepali and FONTASY HIMALI TT, Sagarmatha. Easily extensible to support other fonts. 
  • clean regex based conversion rules
  • well tested to ensure correct conversion, and has test suites and prevent regression of issues.