கணித்தமிழின் காலடித் தடங்கள்
[காலச் சுவடு 2004 ஏப்ரல் இதழில் வெளியான கட்டுரை]
கணித்தமிழின் வரலாறு மிக நீண்டது, மிகப் பரந்தது, மிக ஆழமானது. எத்தனையோ ஆர்வலர்கள், ஆய்வாளர்கள், மாணவர்கள், பேராசிரியர்கள் மற்றும் பயனாளர்களின் பங்களிப்பில் எழுதப்பட்ட கணித்தமிழ் வரலாற்றின் முக்கியக் காலகட்டங்களைச் சுருக்கமாக இங்கு நோக்குவோம்.
(1) எழுத்துருவும் சொல் செயலாக்கியும்
கணித்தமிழின் வரலாறு தமிழ் எழுத்துருவில் (Font) தொடங்கியது என்பதை மறுப்பதற்கில்லை. கணிப்பொறியில் தமிழைக் கையாள 'எழுத்துரு' அடிப்படைத் தேவை ஆகும். எண்பதுகளின் தொடக்கத்தில் கணிப்பொறிகளில் டாஸ் (DOS) இயக்க முறைமையே (Operating System) இருந்தது. டாஸில் பயன்படுத்தக்கூடிய தமிழ் உரைத் தொகுப்பிகள் (Text Editors) எண்பதுகளின் தொடக்கத்திலேயே வெளியிடப்பட்டன. அவற்றில் தமிழ் எழுத்துருக்களும் உள்ளிணைக்கப்பட்டிருந்தன. தமிழ்நாட்டில் சில கல்லூரிகளில் 'பாரதி' பயன்படுத்தப்பட்டது. அமெரிக்க, ஐரோப்பிய, கனடா தமிழர்கள், டாக்டர் சீனிவாசனின் 'ஆதமி'யைப் பயன்படுத்தினர். மலேசியா, சிங்கப்பூர் நாடுகளில் துணைவன், பாரதி, கணியன், முரசு ஆகியவை உருவாக்கப்பட்டன. வட அமெரிக்கப் பல்கலைக்கழகங்களில் பணிபுரிந்த தமிழ் அறிஞர்கள் 'யூனிக்ஸ்' முறைமையில் பயன்படுத்தக்கூடிய தமிழ் எழுத்துருக்களை உருவாக்கினர். 'யூஸ்நெட்' செய்திக்குழுக்களில் பயன்படுத்தப்பட்ட 'மதுரை' எழுத்துரு அவற்றுள் குறிப்பிடத்தக்கது.
கணிப்பொறியில் தமிழ் எழுத்துகள் மென்பொருள் மூலமாகவே சாத்தியப்பட்ட அந்தக் காலகட்டத்தில், இந்தியாவில் புனேயில் இருக்கும் இந்திய அரசு நிறுவனமான C-DAC, கணிப்பொறியில் வட்டார மொழிகளைப் பயன்படுத்த GIST என்னும் வன்பொருள் கார்டினை அறிமுகப்படுத்தியது. சிங்கப்பூரிலும் இது போன்ற EPROM கிராஃபிக்ஸ் கார்டு மூலமாக ஆப்பிள்-II கணிப்பொறிகளில் தமிழ் எடுத்தாளப்பட்டதாகப் பதிவு செய்யப்பட்டுள்ளது.
1985 முதல் 1995 வரையிலான பத்தாண்டுகளில் டாஸ், யூனிக்ஸ், மேக் இயக்க முறைமைகளில் செயல்படக்கூடிய ஏராளமான தமிழ் எழுத்துருக்களும் அவற்றைப் பயன்படுத்தி ஆவணங்களை அச்சிடக்கூடிய ஏராளமான சொல் செயலாக்கி மென்பொருள்களும் தமிழ்நாட்டிலும் தமிழர்கள் வாழும் வெளிநாடுகளிலும் ஏராளமாக உருவாக்கப்பட்டன. ஆஸ்திரேலியாவில் 'கம்பன்', மலேசியாவில் 'நளினம்', சிங்கப்பூரில் 'தாரகை' ஆகியவை குறிப்பிடத்தக்கவை.
தமிழ்நாட்டில் பல்வேறு பத்திரிகை நிறுவனங்கள் தத்தமக்கெனத் தயாரிக்கப்பட்ட மென்பொருள்களைப் பயன்படுத்தினர். தமிழ் நாளிதழ்கள், வார, மாதப் பத்திரிகைகள் இத்தகைய மென்பொருள்களைப் பயன்படுத்தி அச்சேற்றப்பட்டன. புனேயின் மாடுலர் சிஸ்டம்ஸ், சென்னையில் உள்ள காட்கிராஃப், சாஃப்ட்வியூ, லாஸ்டெக், பெங்களூரில் உள்ள ஆப்பிள்சாஃப்ட் போன்ற நிறுவனங்கள் பத்திரிகைப் பணிகளுக்கான மென்பொருள்களையும் எழுத்துருக்களையும் உருவாக்கிப் பரந்த அளவில் சந்தைப்படுத்தின. பழனியப்பா பிரதர்ஸ் நிறுவனம், தனது தமிழ் நூல்களை ஆப்பிள் மெக்கின்டாஷ் கணிப்பொறிகளில் தானே உருவாக்கிய தமிழ் எழுத்துருக்களைப் பயன்படுத்தி வெளியிட்டது.
1985 முதல் 1995 வரையிலான பத்தாண்டுகளில் டாஸ், யூனிக்ஸ், மேக் இயக்க முறைமைகளில் செயல்படக்கூடிய ஏராளமான தமிழ் எழுத்துருக்களும் அவற்றைப் பயன்படுத்தி ஆவணங்களை அச்சிடக்கூடிய ஏராளமான சொல் செயலாக்கி மென்பொருள்களும் தமிழ்நாட்டிலும் தமிழர்கள் வாழும் வெளிநாடுகளிலும் ஏராளமாக உருவாக்கப்பட்டன. ஆஸ்திரேலியாவில் 'கம்பன்', மலேசியாவில் 'நளினம்', சிங்கப்பூரில் 'தாரகை' ஆகியவை குறிப்பிடத்தக்கவை.
தமிழ்நாட்டில் பல்வேறு பத்திரிகை நிறுவனங்கள் தத்தமக்கெனத் தயாரிக்கப்பட்ட மென்பொருள்களைப் பயன்படுத்தினர். தமிழ் நாளிதழ்கள், வார, மாதப் பத்திரிகைகள் இத்தகைய மென்பொருள்களைப் பயன்படுத்தி அச்சேற்றப்பட்டன. புனேயின் மாடுலர் சிஸ்டம்ஸ், சென்னையில் உள்ள காட்கிராஃப், சாஃப்ட்வியூ, லாஸ்டெக், பெங்களூரில் உள்ள ஆப்பிள்சாஃப்ட் போன்ற நிறுவனங்கள் பத்திரிகைப் பணிகளுக்கான மென்பொருள்களையும் எழுத்துருக்களையும் உருவாக்கிப் பரந்த அளவில் சந்தைப்படுத்தின. பழனியப்பா பிரதர்ஸ் நிறுவனம், தனது தமிழ் நூல்களை ஆப்பிள் மெக்கின்டாஷ் கணிப்பொறிகளில் தானே உருவாக்கிய தமிழ் எழுத்துருக்களைப் பயன்படுத்தி வெளியிட்டது.
(2) விண்டோஸ் பயன்பாடுகளில் தமிழ்
1984ஆம் ஆண்டில் ஆப்பிள் நிறுவனம் வரைகலைப் பயனர் இடைமுகம் (Graphical User Interface) கொண்ட மெக்கின்டாஷ் இயக்க முறைமையை வெளியிட்டது. அதனைத் தொடர்ந்து 1985-இல் மைக்ரோசாஃப்ட் நிறுவனம் டாஸில் செயல்படும் விண்டோஸ் இயக்கத் தளத்தை வெளியிட்டது. 1990-இல் விண்டோஸ் 3.0 வெளியிடப்பட்ட பிறகு அடிப்படைக் கணிப்பொறி அனுபவம் இல்லாதோரும் கணிப்பொறியை விரும்பிப் பயன்படுத்தும் நிலை ஏற்பட்டது. உலகம் முழுவதிலும் கணிப்பொறியின் பரவல் அதிகரித்தது. சாதாரண மக்களுக்கான பயன்பாடுகள் அவரவர் தாய்மொழியில் இருக்க வேண்டிய தேவை ஏற்பட்டதால், உலக மக்கள் தத்தம் தாய்மொழிக்கான எழுத்துருக்களையும் பயன்பாடுகளையும் உருவாக்கிக்கொண்டனர்.
இக்காலகட்டத்தில் தமிழ்நாட்டு, வெளிநாட்டு நிறுவனங்கள் பலவும் ஏராளமான தமிழ் எழுத்துருக்களையும் பயன்பாடுகளையும் உருவாக்கின. வட்டார மொழி எழுத்துருக்களை உருவாக்க உலகெங்கும் True Type Font என்னும் தொழில்நுட்பம் பயன்படுத்தப்பட்டது. இவற்றுள் எளிமையானவை 7-பிட் எழுத்துருக்கள். இவற்றில் 128 எழுத்துக் குறிகள் இருக்கும். அக்காலத் தமிழ் எழுத்துருக்கள் பெரும்பாலானவை இத்தகைய 7-பிட் குறியாக்கத்தைக் (encoding) கொண்டவை. இவை பெருமளவு தமிழ்த் தட்டச்சின் வடிவமைப்பை ஒத்தவை. இத்தகைய எழுத்துருக்களை உள்ளீடு செய்யத் தனிச்சிறப்பான நிரல்கள் (keyboard drivers) எதுவும் தேவையில்லை. இவற்றைக் கணிப்பொறியில் நிறுவிய பின் நேரடியாகச் சொல் செயலாக்கி (Word Processor), விரிதாள் (Spreadsheet), தரவுத்தளம் (Database) போன்ற எந்தப் பயன்பாட்டிலும் கையாள முடியும்.
அடுத்த கட்டமாக, ஐரோப்பிய மொழிகளைக் கணிப்பொறியில் பயன்படுத்துவதற்கென 8-பிட் குறியாக்க முறை (Extended ASCII) அறிமுகப்படுத்தப்பட்டது. இதில் 256 எழுத்துக் குறிகளைப் பயன்படுத்திக்கொள்ள முடியும். விண்டோஸ் குறியாக்க முறை 1252 இதற்கு இடம் தந்தது. தமிழ் மொழியின் உயிர், மெய், உயிர்மெய் எழுத்துகளைத் தனித்தனியே அப்படியே உருவகித்துக் கொள்ள இடம் இருந்ததால், பழைய ஆப்செட் அச்சுத் தரத்துக்கு ஈடுகட்டும் வகையில் தமிழ் எழுத்துகளைக் கணிப்பொறி வழியாகச் சிறப்பாக அச்சிட முடிந்தது. தமிழ்ப் பத்திரிகைகள், பதிப்பகங்கள் அனைத்தும் 8-பிட் ஒருமொழிக் குறியாக்கத்தில் அமைந்த எழுத்துருக்களையே பயன்படுத்தத் தொடங்கின. ஆனாலும் இவர்கள் தங்கள் விருப்பப்படி உருவாக்கப்பட்ட எழுத்துருக்களையும் தத்தம் விருப்பப்படி அமைத்துக் கொண்டனர்; எந்தக் குறிப்பிட்ட குறியாக்க (encoding) முறையையும் பின்பற்றவில்லை. எழுத்துரு வடிவமைப்பு நிறுவனங்கள் அவர்கள் விருப்பப்படி குறியாக்கத்தை அமைத்துக் கொடுத்தன.
1985 முதல் 1995 வரையிலான பத்தாண்டுக் காலகட்டத்தில் கணிப்பொறியில் தமிழின் பயன்பாடும் தமிழில் கணிப்பொறிப் பயன்பாடுகளும் பெருமளவு அதிகரித்தபோதும், தரப்பாட்டுக்குள் (standard) அடங்காத எழுத்துருக்களும் அவற்றின் அடிப்படையிலான மென்பொருள்களும் புற்றீசல் போலப் புழக்கத்துக்கு வந்தன. தரப்படுத்தப்பட்ட குறியாக்க முறையே (Standardised Encoding System) இல்லாமைக்கு வணிக உள்நோக்கமும் ஒரு காரணமாக இருந்தது என்பதே உண்மை. இதனால் குழப்பத்துக்கு ஆளானவர்கள் பயனாளர்களே. ஒரு நிறுவனத்திலுள்ள கணிப்பொறியில் தயாரிக்கப்பட்ட ஒரு தமிழ் ஆவணத்தை நகலெடுத்து வேறொரு நிறுவனத்திலுள்ள கணிப்பொறியில் பதிவுசெய்து படித்தறிய முடியாது. காரணம், இரு நிறுவனங்களும் வெவ்வேறு குறியாக்க முறையில் அமைந்த எழுத்துருக்களைப் பயன்படுத்துவதுதான்.
அடுத்த கட்டமாக, ஐரோப்பிய மொழிகளைக் கணிப்பொறியில் பயன்படுத்துவதற்கென 8-பிட் குறியாக்க முறை (Extended ASCII) அறிமுகப்படுத்தப்பட்டது. இதில் 256 எழுத்துக் குறிகளைப் பயன்படுத்திக்கொள்ள முடியும். விண்டோஸ் குறியாக்க முறை 1252 இதற்கு இடம் தந்தது. தமிழ் மொழியின் உயிர், மெய், உயிர்மெய் எழுத்துகளைத் தனித்தனியே அப்படியே உருவகித்துக் கொள்ள இடம் இருந்ததால், பழைய ஆப்செட் அச்சுத் தரத்துக்கு ஈடுகட்டும் வகையில் தமிழ் எழுத்துகளைக் கணிப்பொறி வழியாகச் சிறப்பாக அச்சிட முடிந்தது. தமிழ்ப் பத்திரிகைகள், பதிப்பகங்கள் அனைத்தும் 8-பிட் ஒருமொழிக் குறியாக்கத்தில் அமைந்த எழுத்துருக்களையே பயன்படுத்தத் தொடங்கின. ஆனாலும் இவர்கள் தங்கள் விருப்பப்படி உருவாக்கப்பட்ட எழுத்துருக்களையும் தத்தம் விருப்பப்படி அமைத்துக் கொண்டனர்; எந்தக் குறிப்பிட்ட குறியாக்க (encoding) முறையையும் பின்பற்றவில்லை. எழுத்துரு வடிவமைப்பு நிறுவனங்கள் அவர்கள் விருப்பப்படி குறியாக்கத்தை அமைத்துக் கொடுத்தன.
1985 முதல் 1995 வரையிலான பத்தாண்டுக் காலகட்டத்தில் கணிப்பொறியில் தமிழின் பயன்பாடும் தமிழில் கணிப்பொறிப் பயன்பாடுகளும் பெருமளவு அதிகரித்தபோதும், தரப்பாட்டுக்குள் (standard) அடங்காத எழுத்துருக்களும் அவற்றின் அடிப்படையிலான மென்பொருள்களும் புற்றீசல் போலப் புழக்கத்துக்கு வந்தன. தரப்படுத்தப்பட்ட குறியாக்க முறையே (Standardised Encoding System) இல்லாமைக்கு வணிக உள்நோக்கமும் ஒரு காரணமாக இருந்தது என்பதே உண்மை. இதனால் குழப்பத்துக்கு ஆளானவர்கள் பயனாளர்களே. ஒரு நிறுவனத்திலுள்ள கணிப்பொறியில் தயாரிக்கப்பட்ட ஒரு தமிழ் ஆவணத்தை நகலெடுத்து வேறொரு நிறுவனத்திலுள்ள கணிப்பொறியில் பதிவுசெய்து படித்தறிய முடியாது. காரணம், இரு நிறுவனங்களும் வெவ்வேறு குறியாக்க முறையில் அமைந்த எழுத்துருக்களைப் பயன்படுத்துவதுதான்.
(3) இணையத்தில் தமிழ்
இணையத்தின் வருகை, கணிப்பொறி வரலாற்றில் ஒரு முக்கியமான திருப்புமுனையாக அமைந்தது. உலகத் தமிழர் தமக்குள்ளே கருத்துகளைப் பரிமாறிக் கொள்ள மின்னஞ்சல் வழிவகுத்தது. விண்டோஸ், யூனிக்ஸ், மெக்கின்டாஷ் என எந்தக் கணிப்பொறியாக இருந்தாலும் இணையம்வழி எவ்வித இடையூறும் இன்றித் தகவல் பரிமாறிக்கொள்ள முடியும் என்ற நிலை உருவானது. மேற்கண்ட இயக்க முறைமைகளில் செயல்படக்கூடிய ஒரே மாதிரியான குறியாக்கம் கொண்ட எழுத்துருக்கள் தேவைப்பட்டன. மூன்று பணித்தளங்களிலும் செயல்படக்கூடிய தமிழ் எழுத்துருக்கள் இணையம் வழி இலவசமாக விநியோகிக்கப்பட்டன. மயிலை, இணைமதி, தமிழ்ஃபிக்ஸ் போன்றவை அவற்றுள் சில.
தொண்ணூறுகளின் தொடக்கத்தில் வரைகலை அடிப்படையிலான வைய விரிவலை (WWW) இணையத்தின் அங்கமானது, 1995-இல் விண்டோஸ் 95-இன் அறிமுகம் ஆகியவை இணையத்தை ஒரு புதிய உச்சத்திற்கு உயர்த்தின. இணையத்தில் ஏராளமான தமிழ் வலையகங்கள் (websites) இடம்பெறலாயின.
தமிழ்நாட்டில் அச்சில் வெளிவந்த பல்வேறு நாளேடுகள், வார, மாத இதழ்கள் இணையத்தில் இடம் பிடித்தன. தினபூமி, தினமணி, தினத்தந்தி, தினமலர், ஆனந்த விகடன், குமுதம், கல்கி, கணையாழி ஆகியவை அவற்றுள் சில. இவை தவிர இணையத்தில் மட்டுமே வெளியிடப்பட்ட மின்னிதழ்கள் (e-zines) பலவும் தோன்றலாயின. தமிழ்சினிமா, மின்னம்பலம், ஆறாம்திணை, திண்ணை ஆகியவற்றை முன்னோடிகளாகக் கூறலாம். மின்னிதழ்கள் இணையத்தில் வெளியிடப்பட்டபோதும் அவை கணிப்பொறியின் பல்லூடகத் தொழில்நுட்பத்தின் சிறப்புக் கூறுகளைப் பயன்படுத்திக் கொள்ளவில்லை; அச்சுப் பத்திரிகைகளின் உள்ளடக்கத்தையும், முன்வைப்பு முறையையுமே பின்பற்றின. எனினும் அவை கணித்தமிழின் வளர்ச்சியை அடுத்த கட்டத்துக்கு எடுத்துச் சென்றன என்பதை மறுப்பதற்கில்லை.
இவ்வாறாக இணையத்தில் தமிழின் பரவல் குறிப்பிட்டுச் சொல்லும்படி இருந்தபோதும், இணையப் பயனாளர்களின் அனுபவமோ அவலம் மிக்கதாகவே இருந்தது. தமிழ் வலையகம் ஒவ்வொன்றைப் பார்வையிடவும் ஒவ்வொரு தமிழ் எழுத்துருவைப் பதிவிறக்க (download) வேண்டியதாயிற்று. ஒவ்வொரு இணையப் பத்திரிகையைப் படிக்கவும் வெவ்வேறு எழுத்துருவைப் பதிவிறக்க வேண்டும். இணையத்தில் தகவலை வெளியிட்ட ஒவ்வொருவரும் தமக்கே உரிய எழுத்துருக்களைப் பயன்படுத்தினர். அந்த எழுத்துருக்கள் ஒரே குறியாக்க முறையின் அடிப்படையில் உருவாக்கப்பட்டவை அல்ல. ஆங்கில வலைப்பக்கங்களைப் பொறுத்தவரை வெவ்வேறு எழுத்துருக்களில் அமைந்திருந்தாலும் அவை ஒரே குறியாக்க முறையைப் பின்பற்றுபவை. வெவ்வேறு இயக்க முறைமைகள் என்றாலும் ஒத்த எழுத்துருக் குறியாக்க முறையைப் பின்பற்றின; பயனாளர்கள் தத்தம் கணிப்பொறியில் பார்வையிடத் தடையில்லை. ஆனால் இணையத்தில் பயன்படுத்தப்பட்ட தமிழ் எழுத்துருக்கள் வெவ்வேறு குறியாக்க முறையில் உருவாக்கப்பட்டவை. எனவே, ஒரு வலையகம் எந்த எழுத்துருவில் உருவாக்கப்பட்டதோ அதே எழுத்துருவில் மட்டுமே அதைப் பார்க்க முடியும்.
தொண்ணூறுகளின் தொடக்கத்தில் வரைகலை அடிப்படையிலான வைய விரிவலை (WWW) இணையத்தின் அங்கமானது, 1995-இல் விண்டோஸ் 95-இன் அறிமுகம் ஆகியவை இணையத்தை ஒரு புதிய உச்சத்திற்கு உயர்த்தின. இணையத்தில் ஏராளமான தமிழ் வலையகங்கள் (websites) இடம்பெறலாயின.
தமிழ்நாட்டில் அச்சில் வெளிவந்த பல்வேறு நாளேடுகள், வார, மாத இதழ்கள் இணையத்தில் இடம் பிடித்தன. தினபூமி, தினமணி, தினத்தந்தி, தினமலர், ஆனந்த விகடன், குமுதம், கல்கி, கணையாழி ஆகியவை அவற்றுள் சில. இவை தவிர இணையத்தில் மட்டுமே வெளியிடப்பட்ட மின்னிதழ்கள் (e-zines) பலவும் தோன்றலாயின. தமிழ்சினிமா, மின்னம்பலம், ஆறாம்திணை, திண்ணை ஆகியவற்றை முன்னோடிகளாகக் கூறலாம். மின்னிதழ்கள் இணையத்தில் வெளியிடப்பட்டபோதும் அவை கணிப்பொறியின் பல்லூடகத் தொழில்நுட்பத்தின் சிறப்புக் கூறுகளைப் பயன்படுத்திக் கொள்ளவில்லை; அச்சுப் பத்திரிகைகளின் உள்ளடக்கத்தையும், முன்வைப்பு முறையையுமே பின்பற்றின. எனினும் அவை கணித்தமிழின் வளர்ச்சியை அடுத்த கட்டத்துக்கு எடுத்துச் சென்றன என்பதை மறுப்பதற்கில்லை.
இவ்வாறாக இணையத்தில் தமிழின் பரவல் குறிப்பிட்டுச் சொல்லும்படி இருந்தபோதும், இணையப் பயனாளர்களின் அனுபவமோ அவலம் மிக்கதாகவே இருந்தது. தமிழ் வலையகம் ஒவ்வொன்றைப் பார்வையிடவும் ஒவ்வொரு தமிழ் எழுத்துருவைப் பதிவிறக்க (download) வேண்டியதாயிற்று. ஒவ்வொரு இணையப் பத்திரிகையைப் படிக்கவும் வெவ்வேறு எழுத்துருவைப் பதிவிறக்க வேண்டும். இணையத்தில் தகவலை வெளியிட்ட ஒவ்வொருவரும் தமக்கே உரிய எழுத்துருக்களைப் பயன்படுத்தினர். அந்த எழுத்துருக்கள் ஒரே குறியாக்க முறையின் அடிப்படையில் உருவாக்கப்பட்டவை அல்ல. ஆங்கில வலைப்பக்கங்களைப் பொறுத்தவரை வெவ்வேறு எழுத்துருக்களில் அமைந்திருந்தாலும் அவை ஒரே குறியாக்க முறையைப் பின்பற்றுபவை. வெவ்வேறு இயக்க முறைமைகள் என்றாலும் ஒத்த எழுத்துருக் குறியாக்க முறையைப் பின்பற்றின; பயனாளர்கள் தத்தம் கணிப்பொறியில் பார்வையிடத் தடையில்லை. ஆனால் இணையத்தில் பயன்படுத்தப்பட்ட தமிழ் எழுத்துருக்கள் வெவ்வேறு குறியாக்க முறையில் உருவாக்கப்பட்டவை. எனவே, ஒரு வலையகம் எந்த எழுத்துருவில் உருவாக்கப்பட்டதோ அதே எழுத்துருவில் மட்டுமே அதைப் பார்க்க முடியும்.
(4) எழுத்துரு, விசைப்பலகை தரப்படுத்துதல்
மின்னஞ்சல், அஞ்சல் குழுக்கள், மின்னிதழ்கள், வலையகங்கள் வாயிலாகத் தமிழில் தகவல் பரிமாற்றம் உச்ச கட்டத்தை எட்டியபோதுதான் தரப்படுத்தப்பட்ட தமிழ் எழுத்துருக் குறியாக்கத்தின் தேவை உணரப்பட்டது. உலகெங்கிலுமுள்ள தமிழ் ஆர்வலர்கள் இதுகுறித்துப் பரவலாக விவாதித்தனர். 1996-இல் கலிஃபோர்னியாவின் பெர்க்கிலியில் பேராசியர் ஜார்ஜ் ஹார்ட் இதுபற்றிய கருத்துப் பரிமாற்றத்துக்கு ஒரு கூட்டத்தை ஏற்பாடு செய்தார். அதனைத் தொடர்ந்து, கணித்தமிழ் முன்னோடிகளில் ஒருவரான நா. கோவிந்தசாமி 1997-இல் சிங்கப்பூரில் இணையத்தில் தமிழ்த் தகவல் பரி மாற்றத்துக்கான முதல் சர்வதேச மாநாட்டை நடத்தினார். 'தமிழ்நெட் 97' என்றழைக்கப்பட்ட இந்த மாநாட்டில் உலகெங்கிலுள்ள கணித்தமிழ் ஆர்வலர்களும் அறிஞர்களும் கலந்துகொண்டு, தமிழ் எழுத்துருக் குறியாக்கத் தரப்பாடு பற்றி விவாதித்தனர். இருமொழி 8-பிட் எழுத்துருக் குறியாக்க முறையொன்றைத் தரப்படுத்துதல் பற்றிய சில முக்கியமான முடிவுகள் இம்மாநாட்டில் மேற்கொள்ளப்பட்டன.
'தமிழ்நெட் 97' மாநாட்டுக்குப்பின் இணையம்வழித் தமிழ்த் தகவல் பரிமாற்றத்தில் பங்குபெற்ற தமிழ் ஆர்வலர்கள் 'அஞ்சல் குழு' வழியே விவாதங்களை நடத்தி ஓர் எழுத்துருக் குறியாக்கத்தை வடிவமைத்தனர். அது டிஸ்க்கி (TSCII) என்றழைக்கப்பட்டது. இதனடிப்படையில் அமைந்த தமிழ் எழுத்துருக்கள், மென்பொருள்கள் இலவசமாக வினியோகிக்கப்பட்டன. பிற குறியாக்க முறைகளிலுள்ள ஆவணங்களை டிஸ்க்கிக்கு மாற்றுவதற்கான மென்பொருள்களும் கருவிகளும் உருவாக்கப்பட்டன.
'தமிழ்நெட் 97' மாநாட்டுப் பரிந்துரைகளின் அடிப்படையில் தரப்படுத்தப்பட்ட ஓர் எழுத்துருக் குறியாக்க முறையை வடிவமைப்பதற்கான அடுத்தகட்ட நடவடிக்கைகளைத் தமிழ்நாடு அரசு மேற்கொண்டது. இதற்கென ஓர் உயர்மட்டக் குழு அமைக்கப்பட்டது. நடைமுறையில் இருந்த அனைத்துக் குறியாக்க முறைகளையும் அக்குழு அலசி ஆய்வு செய்தது. 1999 பிப்ரவரியில் சென்னையில் நடைபெற்ற 'தமிழ்நெட் 99' உலகத் தமிழ் இணைய மாநாட்டில் இக்குழுவின் பரிந்துரைகள் முன்வைக்கப்பட்டன. மாநாட்டின் இறுதியில் இரண்டு நகல் குறியாக்க முறைகள் வெளியிடப்பட்டன(TANSCII மற்றும் TAM). தரப்படுத்தப்பட்ட விசைப்பலகை வடிவமைப்புக்கான மாதிரியமும் முன்வைக்கப்பட்டது. 8-பிட் குறியாக்க முறையில் 128-160 ஆகிய இடங்களில் தமிழ் எழுத்துகளைப் பயன்படுத்துவது தொடர்பான விவாதத்தில் இறுதி முடிவு எடுக்க முடியாததால், மாநாட்டைத் தொடர்ந்து, நூறு நாட்களுக்கு விவாதத்துக்கும் சோதனைக்கும் பிறகு இறுதித் தரப்பாடு வெளியிடப்படுமென முடிவு செய்யப்பட்டது.
'தமிழ்நெட் 99' மாநாட்டை ஒட்டித் தமிழ் மென்பொருள் தயாரிப்பாளர்களும் கணித்தமிழ் ஆர்வலர்களும் இணைந்து 'கணித்தமிழ்ச் சங்கம்' என்ற அமைப்பை உருவாக்கினர். அரசின் ஆதரவும் இச்சங்கத்துக்கு இருந்தது. 'தமிழ்நெட் 99' மாநாட்டில் முன்வைக்கப்பட்ட TANSCII, TAM குறியாக்க முறைகளை இச்சங்கத்தினர் ஆய்வுகளையும் சோதனைகளையும் மேற்கொண்டு அவற்றில் இருந்த குறைகளை நீக்கினர். தமிழ் விசைப்பலகை வடிவமைப்பில் இருந்த சிக்கல்களைத் தீர்த்தனர். TAB/TAM ஆகிய இருமொழி/ஒருமொழிக் குறியாக்க முறைகள் முன்வைக்கப்பட்டன. 'தமிழ்99' என்கிற விசைப்பலகை வடிவமைப்பும் பரிந்துரைக்கப்பட்டது. கணித்தமிழ்ச் சங்கத்தின் பரிந்துரைகளைத் தமிழ்நாடு அரசு ஏற்றுக்கொண்டு அரசாணை வெளியிட்டது. இனி வெளியிடப்படும் தமிழ் மென்பொருள்கள் இத்தரப்பாடுகளுக்கு உட்பட்டுள்ளனவா என்பதைப் பரிசோதித்துச் சான்றளிக்கும் பொறுப்பையும் தமிழ்நாடு அரசு கணித்தமிழ்ச் சங்கத்துக்கு வழங்கியது.
உலக அளவில் அனைத்து மொழிகளுக்கும் யூனிகோடு (Unicode) என்னும் பொதுவான ஓர் எழுத்துருக் குறியாக்க முறை உருவாக்கப்பட்டுள்ளது. இது (ஐ.எஸ்.ஓ - 10646) 32-பிட் குறியாக்க முறையாகும். TAB, TAM, TSCII ஆகியவை 8-பிட் குறியாக்கம் என்பதை நினைவில் கொள்க. உலக மொழிகள் அனைத்துக்கும் யூனிகோடில் இடம் வழங்கப்பட்டுள்ளது. யூனிகோடில் தமிழுக்கு 128 இடங்கள் வழங்கப்பட்டுள்ளன. ஒவ்வொரு உயிர்மெய் எழுத்துக்கும் தனித்தனி இடம் கிடையாது. எண்பதுகளில் இந்திய அரசின் சி-டாக் நிறுவனம், இந்திய மொழிகளுக்கென உருவாக்கிய பொதுக் குறியாக்க முறையான இஸ்க்கியை (ISCII) அடிப்படையாகக் கொண்டே யூனிகோடில் இந்திய மொழிகளுக்கு இடங்கள் வழங்கப்பட்டுள்ளன. யூனிகோடில் தமிழ் எழுத்துகள் அகர வரிசைப்படி இடம்பெறவில்லை என்கிற குறைபாடும் சுட்டிக்காட்டப்பட்டுள்ளது. தமிழ்நாடு அரசு யூனிகோடு கூட்டமைப்பில் உறுப்பினராகத் தன்னை இணைத்துக்கொண்டுள்ளது. குறைபாடுகளைக் களைவதற்குத் தமிழ்நாடு அரசு, தமிழ் இணையப் பல்கலைக்கழகம், கணித்தமிழ்ச் சங்கம் ஆகியவை கூட்டு முயற்சிகளை மேற்கொண்டுள்ளன. ஏற்கெனவே ஏராளமான தமிழ் வலைப்பக்கங்கள் யூனிகோடில் வடிவமைக்கப்பட்டு இணையத்தில் வெளியிடப்பட்டுள்ளன. விண்டோஸ், லினக்ஸ், மெக்கின்டாஷ் இயக்க முறைமைகளின் புதிய பதிப்புகள் யூனிகோடை ஏற்கின்றன. வருங்காலத்தில் கணித்தமிழ் யூனிகோடிலேயே அமையும்.
'தமிழ்நெட் 97' மாநாட்டுக்குப்பின் இணையம்வழித் தமிழ்த் தகவல் பரிமாற்றத்தில் பங்குபெற்ற தமிழ் ஆர்வலர்கள் 'அஞ்சல் குழு' வழியே விவாதங்களை நடத்தி ஓர் எழுத்துருக் குறியாக்கத்தை வடிவமைத்தனர். அது டிஸ்க்கி (TSCII) என்றழைக்கப்பட்டது. இதனடிப்படையில் அமைந்த தமிழ் எழுத்துருக்கள், மென்பொருள்கள் இலவசமாக வினியோகிக்கப்பட்டன. பிற குறியாக்க முறைகளிலுள்ள ஆவணங்களை டிஸ்க்கிக்கு மாற்றுவதற்கான மென்பொருள்களும் கருவிகளும் உருவாக்கப்பட்டன.
'தமிழ்நெட் 97' மாநாட்டுப் பரிந்துரைகளின் அடிப்படையில் தரப்படுத்தப்பட்ட ஓர் எழுத்துருக் குறியாக்க முறையை வடிவமைப்பதற்கான அடுத்தகட்ட நடவடிக்கைகளைத் தமிழ்நாடு அரசு மேற்கொண்டது. இதற்கென ஓர் உயர்மட்டக் குழு அமைக்கப்பட்டது. நடைமுறையில் இருந்த அனைத்துக் குறியாக்க முறைகளையும் அக்குழு அலசி ஆய்வு செய்தது. 1999 பிப்ரவரியில் சென்னையில் நடைபெற்ற 'தமிழ்நெட் 99' உலகத் தமிழ் இணைய மாநாட்டில் இக்குழுவின் பரிந்துரைகள் முன்வைக்கப்பட்டன. மாநாட்டின் இறுதியில் இரண்டு நகல் குறியாக்க முறைகள் வெளியிடப்பட்டன(TANSCII மற்றும் TAM). தரப்படுத்தப்பட்ட விசைப்பலகை வடிவமைப்புக்கான மாதிரியமும் முன்வைக்கப்பட்டது. 8-பிட் குறியாக்க முறையில் 128-160 ஆகிய இடங்களில் தமிழ் எழுத்துகளைப் பயன்படுத்துவது தொடர்பான விவாதத்தில் இறுதி முடிவு எடுக்க முடியாததால், மாநாட்டைத் தொடர்ந்து, நூறு நாட்களுக்கு விவாதத்துக்கும் சோதனைக்கும் பிறகு இறுதித் தரப்பாடு வெளியிடப்படுமென முடிவு செய்யப்பட்டது.
'தமிழ்நெட் 99' மாநாட்டை ஒட்டித் தமிழ் மென்பொருள் தயாரிப்பாளர்களும் கணித்தமிழ் ஆர்வலர்களும் இணைந்து 'கணித்தமிழ்ச் சங்கம்' என்ற அமைப்பை உருவாக்கினர். அரசின் ஆதரவும் இச்சங்கத்துக்கு இருந்தது. 'தமிழ்நெட் 99' மாநாட்டில் முன்வைக்கப்பட்ட TANSCII, TAM குறியாக்க முறைகளை இச்சங்கத்தினர் ஆய்வுகளையும் சோதனைகளையும் மேற்கொண்டு அவற்றில் இருந்த குறைகளை நீக்கினர். தமிழ் விசைப்பலகை வடிவமைப்பில் இருந்த சிக்கல்களைத் தீர்த்தனர். TAB/TAM ஆகிய இருமொழி/ஒருமொழிக் குறியாக்க முறைகள் முன்வைக்கப்பட்டன. 'தமிழ்99' என்கிற விசைப்பலகை வடிவமைப்பும் பரிந்துரைக்கப்பட்டது. கணித்தமிழ்ச் சங்கத்தின் பரிந்துரைகளைத் தமிழ்நாடு அரசு ஏற்றுக்கொண்டு அரசாணை வெளியிட்டது. இனி வெளியிடப்படும் தமிழ் மென்பொருள்கள் இத்தரப்பாடுகளுக்கு உட்பட்டுள்ளனவா என்பதைப் பரிசோதித்துச் சான்றளிக்கும் பொறுப்பையும் தமிழ்நாடு அரசு கணித்தமிழ்ச் சங்கத்துக்கு வழங்கியது.
உலக அளவில் அனைத்து மொழிகளுக்கும் யூனிகோடு (Unicode) என்னும் பொதுவான ஓர் எழுத்துருக் குறியாக்க முறை உருவாக்கப்பட்டுள்ளது. இது (ஐ.எஸ்.ஓ - 10646) 32-பிட் குறியாக்க முறையாகும். TAB, TAM, TSCII ஆகியவை 8-பிட் குறியாக்கம் என்பதை நினைவில் கொள்க. உலக மொழிகள் அனைத்துக்கும் யூனிகோடில் இடம் வழங்கப்பட்டுள்ளது. யூனிகோடில் தமிழுக்கு 128 இடங்கள் வழங்கப்பட்டுள்ளன. ஒவ்வொரு உயிர்மெய் எழுத்துக்கும் தனித்தனி இடம் கிடையாது. எண்பதுகளில் இந்திய அரசின் சி-டாக் நிறுவனம், இந்திய மொழிகளுக்கென உருவாக்கிய பொதுக் குறியாக்க முறையான இஸ்க்கியை (ISCII) அடிப்படையாகக் கொண்டே யூனிகோடில் இந்திய மொழிகளுக்கு இடங்கள் வழங்கப்பட்டுள்ளன. யூனிகோடில் தமிழ் எழுத்துகள் அகர வரிசைப்படி இடம்பெறவில்லை என்கிற குறைபாடும் சுட்டிக்காட்டப்பட்டுள்ளது. தமிழ்நாடு அரசு யூனிகோடு கூட்டமைப்பில் உறுப்பினராகத் தன்னை இணைத்துக்கொண்டுள்ளது. குறைபாடுகளைக் களைவதற்குத் தமிழ்நாடு அரசு, தமிழ் இணையப் பல்கலைக்கழகம், கணித்தமிழ்ச் சங்கம் ஆகியவை கூட்டு முயற்சிகளை மேற்கொண்டுள்ளன. ஏற்கெனவே ஏராளமான தமிழ் வலைப்பக்கங்கள் யூனிகோடில் வடிவமைக்கப்பட்டு இணையத்தில் வெளியிடப்பட்டுள்ளன. விண்டோஸ், லினக்ஸ், மெக்கின்டாஷ் இயக்க முறைமைகளின் புதிய பதிப்புகள் யூனிகோடை ஏற்கின்றன. வருங்காலத்தில் கணித்தமிழ் யூனிகோடிலேயே அமையும்.
(5) இயக்க முறைமைகளில் தமிழ்
கணித்தமிழின் முக்கியத்துவத்தை முதன்முதலாக மைக்ரோசாஃப்ட் நிறுவனமே உணர்ந்தது எனக் கூறலாம். உலகம் முழுவதும் 90%-க்கும் அதிகமான கணிப்பொறிகளில் மைக்ரோசாஃப்ட்டின் விண்டோஸ் இயக்க முறைமையே செயல்படுகிறது. மைக்ரோசாஃப்ட் தனது விண்டோஸ் 2000 இயக்க முறைமையில் இந்தியையும் தமிழையும் இடம்பெறச் செய்தது. ஆவணங்களைத் தமிழில் உருவாக்கிய நிலை அடுத்த பரிமாணத்தை எட்டியது. ஆவணங்களுக்குத் தமிழிலேயே பெயரிட முடியும். கோப்புறைகளின் பெயர்கள் மற்றும் கணிப்பொறியில் அனைத்துவகைத் தகவல்களையும் தமிழிலேயே கையாள முடியும். மின்னஞ்சல் மற்றும் பிற தகவல் பரிமாற்றங்களையும் மிக இயல்பாகத் தமிழ் மொழியிலேயே மேற்கொள்ள விண்டோஸ் இடம் தந்தது. விண்டோஸ், எம்எஸ் ஆஃபீஸ் ஆகியவற்றைத் தமிழ் மட்டுமே அறிந்த ஒரு பயனாளர் பயன்படுத்த முடியும் என்பது கணித்தமிழ் வரலாற்றில் ஒரு குறிப்பிடத்தக்க நிகழ்வு. அடுத்து வந்த விண்டோஸ் எக்ஸ்பீயில் பதினொரு இந்திய மொழிகள் இடம்பெற்றன.
விண்டோஸைத் தொடர்ந்து லினக்ஸிலும் தமிழ் இடம்பெறத் தொடங்கியது. விண்டோ ஸைப் போலன்றி, லினக்ஸ் இயக்க முறைமையை எவர் வேண்டுமானாலும் தம் விருப்பப்படி மாற்றியமைத்துப் புதிய பெயரில் வெளியிட முடியும். அவ்வாறு வெளியிடப்பட்டுள்ள பல்வேறு லினக்ஸ் பதிப்புகளில் தமிழ் உள்ளிணைக்கப்பட்டுள்ளது. கணித்தமிழ் வரலாற்றில் இது ஒரு முக்கிய மைல்கல்.
விண்டோஸைத் தொடர்ந்து லினக்ஸிலும் தமிழ் இடம்பெறத் தொடங்கியது. விண்டோ ஸைப் போலன்றி, லினக்ஸ் இயக்க முறைமையை எவர் வேண்டுமானாலும் தம் விருப்பப்படி மாற்றியமைத்துப் புதிய பெயரில் வெளியிட முடியும். அவ்வாறு வெளியிடப்பட்டுள்ள பல்வேறு லினக்ஸ் பதிப்புகளில் தமிழ் உள்ளிணைக்கப்பட்டுள்ளது. கணித்தமிழ் வரலாற்றில் இது ஒரு முக்கிய மைல்கல்.
(6) கலைச் சொல்லாக்கம்
கணிப்பொறியியலின் கலைச்சொற்களை உருவாக்கியதில் பலரது பங்களிப்பு உள்ளது. கணித்தமிழ் ஆர்வலர்கள், இணையத்தில் இயங்கும் சமூகக் குழுக்கள், தமிழ் நாளிதழ்கள், வார, மாதப் பத்திரிகைகள், நூலாசிரியர்கள், அரசு மற்றும் பல்கலைக்கழகங்கள் அமைத்த கலைச்சொல்லாக்கக் குழுக்கள், சங்கங்கள் ஆகிய அனைவருமே கணித்தமிழ்க் கலைச்சொல்லாக்கத்தில் கணிசமாகப் பங்காற்றியுள்ளனர்.
எழுத்தாளர் சுஜாதா பத்திரிகைகளில் எழுதியதோடு ஆயிரம் கணிப்பொறி வார்த்தைகள் என்னும் நூலை வெளியிட்டார். அண்ணா பல்கலைக்கழகத்தின் வளர்தமிழ் மன்றம் கலைச்சொல் தொகுப்பை வெளியிட்டது. 1993-94 ஆம் ஆண்டுகளில் தினமலர் நாளிதழில் கணிப்பொறிப் பாடங்கள் தமிழில் விளக்கி எழுதப்பட்டன. 1994-இல் இந்தியாவிலேயே முதன்முறையாக ஒரு வட்டார மொழியில் கணிப்பொறித் தொழில்நுட்பத்துக்கெனத் தனியாக ஒரு மாத இதழ் (இப்போது மாதமிரு முறை) - ’தமிழ் கம்ப்யூட்டர்’ - தமிழில் வெளியிடப்பட்டது. அனைத்து நவீனக் கணிப்பொறித் தொழில்நுட்பங்களும் ஆங்கில இதழ்களில் எழுதப்படுவதற்கு முன்பே தமிழில் எழுதப்பட்டன. சி, சி++, சி#, நெட்ஒர்க், ஆரக்கிள், ஜாவா, விஷுவல் பேசிக், ஏஎஸ்பீ, விண்டோஸ், லினக்ஸ், ஹெச்டீஎம்எல், ஹார்டுவேர், ஆட்டோகேட், டேலி, டிடீபீ, கிராஃபிக்ஸ், அனிமேஷன் ஆகிய அனைத்துமே தமிழில் எழுதப்பட்டன. தமிழ் இணையம், கம்ப்யூட்டர் உலகம், கம்ப்யூட்டர் நேரம், கணிமொழி போன்ற இதழ்களும் வெளியாயின. இவற்றில் கலைச்சொல்லாக்கப் பகுதிகளும் இடம்பெற்றன. மனோரமா தமிழ் இயர்புக்கில் 1995 முதல் ஆண்டுதோறும் வெளியிடப்படும் நவீனத் தகவல் தொழில்நுட்பங்கள் தொடர்பான கட்டுரைகளையும் இங்குக் குறிப்பிட்டுக் கூற வேண்டும்.
'தமிழ்நெட் 99' மாநாட்டைத் தொடர்ந்து, எம்எஸ் ஆஃபீஸ் தொகுப்பிலுள்ள சில நூறு சொற்களைத் தமிழ்ப்படுத்த சுஜாதா தலைமையில் ஒரு குழு அமைக்கப்பட்டது. [அக்குழுவில் நானும் ஓர் உறுப்பினர்]. பலத்த விவாதங்களுக்குப் பின் ஒருமனதான பட்டியல் பத்திரிகைகளில் வெளியிடப்பட்டது. மணவை முஸ்தபா முதல் கலைச்சொல் தொகுப்பை 1999-இல் என்னுடைய மேற்பார்வையில் வெளியிட்டார். இரண்டாம் பதிப்பு எனது முழுமையான பங்களிப்பில் 2001-இல் வெளியிடப்பட்டது. இலங்கை அரசின் அரசக் கரும மொழிகள் ஆணைக்குழு 2000-இல் கலைச்சொல் அகரமுதலியை வெளியிட்டது.
2001-இல் முனைவர் மு. ஆனந்தகிருஷ்ணன் தலைமையில் தகவல் தொழில்நுட்பக் கலைச்சொல்லாக்கக் குழுவைத் தமிழ்நாடு அரசு அமைத்தது. எட்டாயிரம் கலைச்சொற்கள் கொண்ட தொகுப்பு 2001 ஏப்ரலில் அரசிடம் வழங்கப்பட்டது. இப்பணியில் குழுவின் உறுப்பினரான என்னுடைய பங்களிப்பு கணிசமானது. இக்கலைச்சொல் தொகுப்பு தமிழ் இணையப் பல்கலைக்கழக வலையகத்தில் உள்ளது. தமிழ் இணைய மாநாடுகளில் கலைச்சொல்லாக்கத்துக்கெனத் தனிப்பட்ட முயற்சிகள் மேற்கொள்ளப்பட்டன. இதற்கென அமைக்கப்பட்ட பணிக்குழுவில் நானும் உறுப்பினராக இருந்துள்ளேன். மூவாயிரத்துக்கும் மேற்பட்ட கலைச்சொற்களின் தொகுப்பு தமிழ் இணையம் சார்பாக வெளியிடப்பட்டது.
மைக்ரோசாஃப்ட் நிறுவனம் தன்னுடைய விண்டோஸ் எக்ஸ்பீ, ஆஃபீஸ் எக்ஸ்பீ ஆகியவற்றுக்காக Community Glossary என்ற பெயரில் கலைச்சொற்களைப் பொதுமக்களிடமிருந்து பெற்றுச் சிறந்தவற்றைத் தேர்ந்தெடுத்துப் பயன்படுத்திக்கொண்டது. [நான் பரிந்துரைத்த அதிக எண்ணிக்கையிலான கலைச்சொற்கள் ஏற்றுக் கொள்ளப்பட்டன].
ஏராளமான கணிப்பொறி நூல்கள் தமிழில் வெளியிடப்பட்டுள்ளன. அவற்றுள் பெரும்பாலானவை தமிழில் எழுதப்பட்ட ஆங்கில நூல்கள் என்றே கூற வேண்டும். அவற்றுள் சில கணிப்பொறி அறிவும் தமிழறிவும் இல்லாதோர் மொழிபெயர்த்தவை. இவற்றை வெளியிட்ட பதிப்பகங்களின் நோக்கம் காற்றுள்ளபோதே காசு பார்த்துவிட வேண்டும் என்பதே. இவற்றில் பெரும்பாலான நூல்கள் கலைச்சொல்லாக்கத்துக்குக் கடுகளவும் பங்களிக்கவில்லை. இடைமுகங்களால் (interfaces) கணித்தமிழுக்கு ஏற்பட்ட சங்கடங்களையும் இங்குக் குறிப்பிட வேண்டும். ஏற்கெனவே பயனாளர்களிடம் செல்வாக்குப் பெற்று விளங்கும் மென்பொருள்களின் ஆங்கில இடைமுகத்தைத் தமிழில் வடிவமைக்கும்போது மிகுந்த கவனம் தேவை.
எழுத்தாளர் சுஜாதா பத்திரிகைகளில் எழுதியதோடு ஆயிரம் கணிப்பொறி வார்த்தைகள் என்னும் நூலை வெளியிட்டார். அண்ணா பல்கலைக்கழகத்தின் வளர்தமிழ் மன்றம் கலைச்சொல் தொகுப்பை வெளியிட்டது. 1993-94 ஆம் ஆண்டுகளில் தினமலர் நாளிதழில் கணிப்பொறிப் பாடங்கள் தமிழில் விளக்கி எழுதப்பட்டன. 1994-இல் இந்தியாவிலேயே முதன்முறையாக ஒரு வட்டார மொழியில் கணிப்பொறித் தொழில்நுட்பத்துக்கெனத் தனியாக ஒரு மாத இதழ் (இப்போது மாதமிரு முறை) - ’தமிழ் கம்ப்யூட்டர்’ - தமிழில் வெளியிடப்பட்டது. அனைத்து நவீனக் கணிப்பொறித் தொழில்நுட்பங்களும் ஆங்கில இதழ்களில் எழுதப்படுவதற்கு முன்பே தமிழில் எழுதப்பட்டன. சி, சி++, சி#, நெட்ஒர்க், ஆரக்கிள், ஜாவா, விஷுவல் பேசிக், ஏஎஸ்பீ, விண்டோஸ், லினக்ஸ், ஹெச்டீஎம்எல், ஹார்டுவேர், ஆட்டோகேட், டேலி, டிடீபீ, கிராஃபிக்ஸ், அனிமேஷன் ஆகிய அனைத்துமே தமிழில் எழுதப்பட்டன. தமிழ் இணையம், கம்ப்யூட்டர் உலகம், கம்ப்யூட்டர் நேரம், கணிமொழி போன்ற இதழ்களும் வெளியாயின. இவற்றில் கலைச்சொல்லாக்கப் பகுதிகளும் இடம்பெற்றன. மனோரமா தமிழ் இயர்புக்கில் 1995 முதல் ஆண்டுதோறும் வெளியிடப்படும் நவீனத் தகவல் தொழில்நுட்பங்கள் தொடர்பான கட்டுரைகளையும் இங்குக் குறிப்பிட்டுக் கூற வேண்டும்.
'தமிழ்நெட் 99' மாநாட்டைத் தொடர்ந்து, எம்எஸ் ஆஃபீஸ் தொகுப்பிலுள்ள சில நூறு சொற்களைத் தமிழ்ப்படுத்த சுஜாதா தலைமையில் ஒரு குழு அமைக்கப்பட்டது. [அக்குழுவில் நானும் ஓர் உறுப்பினர்]. பலத்த விவாதங்களுக்குப் பின் ஒருமனதான பட்டியல் பத்திரிகைகளில் வெளியிடப்பட்டது. மணவை முஸ்தபா முதல் கலைச்சொல் தொகுப்பை 1999-இல் என்னுடைய மேற்பார்வையில் வெளியிட்டார். இரண்டாம் பதிப்பு எனது முழுமையான பங்களிப்பில் 2001-இல் வெளியிடப்பட்டது. இலங்கை அரசின் அரசக் கரும மொழிகள் ஆணைக்குழு 2000-இல் கலைச்சொல் அகரமுதலியை வெளியிட்டது.
2001-இல் முனைவர் மு. ஆனந்தகிருஷ்ணன் தலைமையில் தகவல் தொழில்நுட்பக் கலைச்சொல்லாக்கக் குழுவைத் தமிழ்நாடு அரசு அமைத்தது. எட்டாயிரம் கலைச்சொற்கள் கொண்ட தொகுப்பு 2001 ஏப்ரலில் அரசிடம் வழங்கப்பட்டது. இப்பணியில் குழுவின் உறுப்பினரான என்னுடைய பங்களிப்பு கணிசமானது. இக்கலைச்சொல் தொகுப்பு தமிழ் இணையப் பல்கலைக்கழக வலையகத்தில் உள்ளது. தமிழ் இணைய மாநாடுகளில் கலைச்சொல்லாக்கத்துக்கெனத் தனிப்பட்ட முயற்சிகள் மேற்கொள்ளப்பட்டன. இதற்கென அமைக்கப்பட்ட பணிக்குழுவில் நானும் உறுப்பினராக இருந்துள்ளேன். மூவாயிரத்துக்கும் மேற்பட்ட கலைச்சொற்களின் தொகுப்பு தமிழ் இணையம் சார்பாக வெளியிடப்பட்டது.
மைக்ரோசாஃப்ட் நிறுவனம் தன்னுடைய விண்டோஸ் எக்ஸ்பீ, ஆஃபீஸ் எக்ஸ்பீ ஆகியவற்றுக்காக Community Glossary என்ற பெயரில் கலைச்சொற்களைப் பொதுமக்களிடமிருந்து பெற்றுச் சிறந்தவற்றைத் தேர்ந்தெடுத்துப் பயன்படுத்திக்கொண்டது. [நான் பரிந்துரைத்த அதிக எண்ணிக்கையிலான கலைச்சொற்கள் ஏற்றுக் கொள்ளப்பட்டன].
ஏராளமான கணிப்பொறி நூல்கள் தமிழில் வெளியிடப்பட்டுள்ளன. அவற்றுள் பெரும்பாலானவை தமிழில் எழுதப்பட்ட ஆங்கில நூல்கள் என்றே கூற வேண்டும். அவற்றுள் சில கணிப்பொறி அறிவும் தமிழறிவும் இல்லாதோர் மொழிபெயர்த்தவை. இவற்றை வெளியிட்ட பதிப்பகங்களின் நோக்கம் காற்றுள்ளபோதே காசு பார்த்துவிட வேண்டும் என்பதே. இவற்றில் பெரும்பாலான நூல்கள் கலைச்சொல்லாக்கத்துக்குக் கடுகளவும் பங்களிக்கவில்லை. இடைமுகங்களால் (interfaces) கணித்தமிழுக்கு ஏற்பட்ட சங்கடங்களையும் இங்குக் குறிப்பிட வேண்டும். ஏற்கெனவே பயனாளர்களிடம் செல்வாக்குப் பெற்று விளங்கும் மென்பொருள்களின் ஆங்கில இடைமுகத்தைத் தமிழில் வடிவமைக்கும்போது மிகுந்த கவனம் தேவை.
(7) பிற மின்னணுச் சாதனங்களில் தமிழ்
கணிப்பொறியில் மட்டுமின்றி மின்னணுச் சாதனங்கள் எதிலும் இடம்பெறும் தமிழையும் கணித்தமிழாகவே கருதுவதில் தவறில்லை. அந்த வகையில் இன்றைக்கு ஏடீஎம் பொறிகளில் (ATM) தமிழைக் காண்கிறோம். பல்வேறு நிறுவனங்கள் வாடிக்கையாளர்களுக்கு அமைத்துக் கொடுத்துள்ள தொடுதிரைகளில் (touch screens) தமிழைக் காண்கிறோம். சிம்ப்யூட்டர் எனப்படும் கையடக்கக் கணிப்பொறியில் தமிழ் உண்டு. எல்ஜி நிறுவனம் முதன்முதலாக செல்பேசிகளில் தமிழைப் புகுத்தியது. நோக்கியா நிறுவனமும் தனது செல்பேசிகளில் தமிழை இடம்பெறச் செய்துள்ளது. செல்பேசி மெனுக்கள் தமிழிலேயே இருக்கும். தமிழிலேயே குறுஞ்செய்தி (SMS) அனுப்பலாம். செல்பேசி/பிடிஏ. கையகக் கணிப்பொறிகளில் செயல்படும் விண்டோஸ் சிஇ, விண்டோஸ் மொபைல் மற்றும் அவற்றில் இயங்கும் வேர்டு/எக்சல் ஆகியவையும் கணித்தமிழ் பேசும் நாள் வெகு தொலைவில் இல்லை.
(8) கணித்தமிழ் ஆய்வுக் களங்கள்
'கணித்தமிழ்' என்பது எழுத்துருக்கள், இடைமுகங்கள், கலைச்சொற்கள் இவற்றில் மட்டுமே அடங்கிப்போய்விடவில்லை. இதன் களங்கள் பரந்துபட்டவை. கால்பதிக்க வேண்டிய துறைகள் பலப்பல. கண்டெடுக்க வேண்டிய தொழில்நுட்பங்கள் ஏராளம். இவை ஒவ்வொன்றாய்ச் சாத்தியப்பட்டு வருகின்றன. கணித்தமிழின் ஆய்வுக் களங்கள் சிலவற்றைப் பார்ப்போம்.
(i) சொல் / இலக்கணப் பிழைதிருத்தம் (Spell Check / Grammar Check)
எம்எஸ் வேர்டில் ஓர் ஆவணத்தில் ஆங்கில உரையை உள்ளீடு செய்யும்போதே சொற்பிழை, இலக்கணப் பிழைகளைச் சுட்டிக்காட்டும்; பிழை திருத்தத்துக்கான வழிமுறைகளைக் கூறும். 'பொன் மொழி' போன்ற பல சொல் செயலாக்கிகளில் இன்றைக்குச் சொற்பிழை திருத்த மென்பொருள் கருவிகள் உள்ளிணைக்கப்பட்டுள்ளன. இதை இலக்கணப் பிழை திருத்தத்துக்கு நீட்டிப்பதற்கான ஆய்வுகளும் நடைபெற்று வருகின்றன.
(ii) சொல் பிரித்தல் (Hyphenation)
'பேஜ்மேக்கர்' போன்ற டிடீபீ மென்பொருள்களில் நூல்களைப் பதிப்பிடும்போது, பக்க வடிவமைப்பு (page layout) மேற்கொள்ளும்போது, வலப்பக்க ஓரங்களில் சொற்களைப் பிரிக்க வேண்டிய கட்டாயம் நேரும். நாமாக வலிந்து பிரித்தால், வடிவமைப்பு மாறும்போது சொல்லின் இடையில் இடவெளிகள் (spaces) உருவாகும். இதனைத் தவிர்ப்பதற்கான செயல்நுட்பமே 'ஹைஃபனேஷன்' எனப்படுவது. டிடீபீ மென்பொருள்களில் ஆங்கில மொழிக்கு இவ்வசதி முன்னியல்பாக அமைந்துள்ளது. தமிழ்மொழிக்கு ஹைஃபனேஷன் கருவிகள் உருவாக்கப்பட்டுள்ளன.
(iii) வரிசையாக்கமும் தேடலும் (Sorting and Searching)
தரவுத் தளங்களில் (databases) தேடல் விரைவுபடுத்தப்பட வேண்டுமெனில் தரவுகள் (data) அகர வரிசையில் வரிசையாக்கப்பட (sorting) வேண்டும். எழுத்துருக் குறியாக்க முறைகள் வரிசையாக்கத்துக்கு ஒத்துழைக்க வேண்டும். யூனிகோடு குறியாக்க முறையிலேயே தமிழ் எழுத்துகள் அகர வரிசைப்படி அமைக்கப்படவில்லை. எனவே வரிசையாக்கத்துக்கான சிறந்த தீர்வுநெறிகள் (sorting algorithms) கண்டறியப்பட வேண்டும்.
தமிழ் வலைப்பக்கங்களில் தகவலைத் தேடிப் பெறுவதற்கான சிறந்த தீர்வுநெறிகள் உருவாக்கப்பட வேண்டும். சொற்களின் பொருளையும் அடிப்படையாகக் கொண்டு தேடும் தேடுபொறிகள் உருவாக்கப்பட வேண்டும். 'மலர்கள்' எனத் தேடும்போது 'பூக்கள்' இடம்பெற்ற ஆவணங்களும் தேடுபொறியில் சிக்க வேண்டும்.
தமிழ் வலைப்பக்கங்களில் தகவலைத் தேடிப் பெறுவதற்கான சிறந்த தீர்வுநெறிகள் உருவாக்கப்பட வேண்டும். சொற்களின் பொருளையும் அடிப்படையாகக் கொண்டு தேடும் தேடுபொறிகள் உருவாக்கப்பட வேண்டும். 'மலர்கள்' எனத் தேடும்போது 'பூக்கள்' இடம்பெற்ற ஆவணங்களும் தேடுபொறியில் சிக்க வேண்டும்.
(iv) ஓசிஆர் (OCR - Optical Character Recognition)
அச்சிட்ட ஓர் ஆவணத்தை பிட்மேப் ஃபைலாக ஸ்கேன் செய்து அதனைக் கணிப்பொறித் தகவலாக (digital information) மாற்றியமைக்கும் செயல்நுட்பமே ஓசிஆர் எனப்படுவது. ஆங்கிலத்துக்கென ஓசிஆர் மென்பொருள் கருவிகள் ஏராளமாக உள்ளன. அவை தமிழுக்கு வேண்டாமா? ஓசிஆர் மூலம் கணிப்பொறித் தகவலாய் மாற்றிச் சேமித்து வைத்துக்கொண்டால் அதில் எந்தத் தகவல் குறிப்பையும் தேடிப் பெற முடியும். தொகுத்து வெளியிட முடியும். தமிழ்நாடு அரசின் நிதி உதவியுடன் 'பொன்விழி' என்னும் தமிழ் ஓசிஆர் உருவாக்கப்பட்டு விற்பனையில் உள்ளது.
(v) கையெழுத்து அறிதல் (Handwriting Recognition)
ஓசிஆரின் அடுத்த கட்டம் இது. அச்சிட்ட ஆவணம் மட்டுமின்றிக் கையெழுத்து ஆவணங்களையும் கணிப்பொறித் தகவலாய் மாற்றும் கருவி தமிழுக்கு வேண்டும். டேப்லட் பீசி (Tablet PC) எனப்படும் கணிப்பொறிகளில் திரையில் மின்பேனாவில் ஆங்கிலத்தில் எழுதிக் கணிப்பொறி ஆவணமாகச் சேமிக்க முடியும். கணிப்பொறிக்கான கட்டளைகளைக் கையால் எழுதி உணர்த்த முடியும். அதேபோன்று தமிழுக்கும் கையெழுத்து ஆவணங்களைக் கணிப்பொறி ஆவணமாக்கும் ஆய்வுகள் முழுமூச்சில் நடைபெற்று வருகின்றன.
(vi) குரல் அறிதல் (Voice Recognition)
கணிப்பொறி முன் அமர்ந்து டிக்டா ஃபோன் என்னும் கருவியில் பேசப் பேசக் கணிப்பொறி அதனை உரை ஆவணமாக மாற்றித் தரும். ஆங்கில மொழிக் குரலறி மென்பொருள்கள் நிறைய உள்ளன. தமிழுக்கும் அதுபோன்ற மென்பொருள் உருவாக்கப்பட வேண்டும். அதற்கான ஆய்வுகள் நடைபெற்று வருகின்றன.
(vii) உரையைக் குரலாக்குதல் (Text to voice)
கணிப்பொறியில் உள்ள ஓர் ஆவணத்தைத் திறக்கிறீர்கள். ஒரு பொத்தானை அழுத்தியதும் அந்த ஆவணத்தில் உள்ள விவரங்களைக் கணிப்பொறியே உங்களுக்குப் படித்துக் காட்டும். இதுவும் தமிழில் வேண்டும்.
(viii) எந்திர மொழிபெயர்ப்பு (Machine Translation)
இணையத்தில் ஒரு வலையகத்தில் ஜெர்மன் மொழியில் சில தகவல்கள் சேமித்துவைக்கப்பட்டுள்ளன. அவை உங்களுக்குத் தேவைப்படுகின்றன. இணையத்தில் அத்தகவல்களைப் பார்வையிடும்போதே (on the fly) ஆங்கிலத்தில் மொழிபெயர்த்துத் தரப்படுவதாயின் எப்படி இருக்கும்? இதற்கான மென்பொருள்கள் இப்போது பயன்பாட்டில் உள்ளன. அவை துல்லியமான மொழிபெயர்ப்பைத் தராவிட்டாலும் அத்தகவல்களை ஓரளவு புரிந்து கொள்ளும் அளவுக்கு மொழிபெயர்ப்பு இருக்கும். இதுவே 'எந்திர மொழிபெயர்ப்பு'. ஆங்கிலம் உட்படப் பல மேனாட்டு மொழிகளுக்கான எந்திர மொழிபெயர்ப்பு மென்பொருள்கள் பயன்பாட்டில் உள்ளன. ஆங்கிலம்-தமிழ் மொழிபெயர்ப்புக்கான எந்திர மொழிபெயர்ப்பு மென்பொருள்கள் இன்னும் தொடக்க நிலையிலேயே உள்ளன.
(ix) மின்-அரசாண்மை (e-Governance)
ஓர் அலுவலகத்தின் தகவல் மேலாண்மையும் தகவல் பரிமாற்றமும் தாள்கள் மூலமாக நடைபெறாமல் முற்றிலும் கணிப்பொறி வழியாகவே நடை பெறுவதற்கான மென்பொருள் பயன்பாடுகள் புழக்கத்தில் உள்ளன. அதாவது இன்றைய சூழ்நிலையில் 'தாளில்லா அலுவலகம்' (paperless office) சாத்தியமே. அதுபோலவே, அரசு அலுவலகங்களைக் கணிப்பொறிப் பிணையங்கள் (computer networks) மூலமாகப் பிணைத்து அனைத்து அரசு நடவடிக்கைகளையும் தகவல் பரிமாற்றங்களையும் கணிப்பொறி மூலமாக மேற்கொள்ள முடியும். அரசின் திட்டப் பணிகள் விரைவாக நிறைவேறும். அவற்றின் பலன்கள் நேரடியாக மக்களைப் போய்ச் சேரும். ஊழல் குறையும். இத்தகைய அரசாட்சியை 'மின்-அரசாண்மை' என்கிறோம். தமிழ்நாட்டில் மின்-அரசாண்மை நடைமுறையாக்கம் மிக மெதுவாகவே மேற்கொள்ளப்பட்டு வருகிறது.
(9) கணித்தமிழில் கல்வி
வேறெந்த அறிவியல் தொழில்நுட்பத்தை விடவும் கணிப்பொறித் தொழில்நுட்பத்துக்கென ஏராளமான நூல்கள் வெளியிடப்பட்டுள்ளன. ஏற்கெனவே கூறியபடி அவற்றுள் பல பயனற்றவை என்றபோதிலும் சிறந்த நூல்களும் வெளியிடப்பட்டுள்ளன. தமிழ்நாடு அரசுப் பள்ளிகளில் பிளஸ்-1, பிளஸ்-2 மாணவர்களுக்கான கணிப்பொறியியல் புத்தகங்கள் தமிழில் வெளியிடப்படுகின்றன. தமிழ்வழி பயிலும் மாணவர்களுக்கு ஆறாம் வகுப்பிலிருந்து கணிப்பொறி இயல் விருப்பப் பாடமா