সার্বভৌমত্বের ফাঁক (The Sovereignty Gap)
গত প্রায় এক দশক ধরে ডিজিটাল দুনিয়া একটি আরামদায়ক বিভ্রমে চলছিল—ইন্টারনেট নাকি সীমান্তহীন, যেখানে কোডই সবকিছু, ভৌগোলিক অবস্থান কোনো গুরুত্ব রাখে না। কিন্তু জেনারেটিভ এআই-এর বিস্ফোরক উত্থান সেই ধারণাকে ভেঙে দিয়েছে এবং সামনে এনেছে এক কঠিন ভূরাজনৈতিক বাস্তবতা। যখন বিশ্বজুড়ে কাস্টমার সার্ভিস থেকে শুরু করে আদালতের খসড়া লেখাতেও বড় ভাষা মডেল (LLM) ব্যবহারের হুড়োহুড়ি শুরু হলো, তখন গ্লোবাল সাউথে নিঃশব্দে একটি সংকট মাথাচাড়া দিল। এই সংকট সক্ষমতার নয়, বরং মালিকানার।
এই সংকটের নামই “সার্বভৌমত্বের ফাঁক”—একটি দেশের কৃত্রিম বুদ্ধিমত্তার প্রয়োজন এবং সেই প্রযুক্তির উপর নিয়ন্ত্রণ রাখার ক্ষমতার মাঝের বিপজ্জনক দূরত্ব।
ডেটা উপনিবেশবাদের নতুন যুগ
সার্বভৌমত্বের ফাঁক বুঝতে হলে আধুনিক তথ্যপ্রবাহের দিকে তাকাতে হয়। বহু বছর ধরেই ভারতসহ অনেক দেশ বিশ্বের সবচেয়ে বড় কাঁচা ডিজিটাল ডেটা উৎপাদক। প্রতিটি ইউপিআই লেনদেন, প্রতিটি টেলিমেডিসিন পরামর্শ, কিংবা স্থানীয় ভাষায় করা সামাজিক যোগাযোগমাধ্যমের পোস্ট—সব মিলিয়ে তৈরি হচ্ছে বিপুল ডিজিটাল ডেটা। প্রচলিত এআই ব্যবস্থায় এই ডেটা প্রায়ই সংগ্রহ, পরিশোধন ও বিশ্লেষণ করা হয় বিদেশের সার্ভারে, যেমন ক্যালিফোর্নিয়া বা উত্তর ভার্জিনিয়ায়।
বিশেষজ্ঞরা একে বলেছেন “ডেটা উপনিবেশবাদ”। ঔপনিবেশিক যুগে যেমন কাঁচামাল বাইরে পাঠিয়ে পরে চড়া দামে তৈরি পণ্য কিনতে হতো, আজকের ডিজিটাল অর্থনীতিতেও অনেক দেশ তাদের নিজস্ব “বুদ্ধিমত্তা” রপ্তানি করে পরে সেটাই এপিআইয়ের মাধ্যমে ভাড়া নিতে বাধ্য হচ্ছে।
এই নির্ভরতার সমস্যা শুধু অর্থনৈতিক নয়, কাঠামোগতও। যখন একটি দেশ পুরোপুরি পশ্চিমা ফাউন্ডেশন মডেলের উপর নির্ভর করে, তখন সে আসলে নিজের বুদ্ধিবৃত্তিক পরিকাঠামো বাইরের হাতে তুলে দেয়। এসব মডেল অনেকটাই “ব্ল্যাক বক্স”—ভিতরে কীভাবে সিদ্ধান্ত নেওয়া হচ্ছে, তার ওপর কোনো স্বচ্ছতা নেই। মুম্বাইয়ের কোনো সরকারি দপ্তর যদি বিদেশি মডেল দিয়ে আইনি নথির সারসংক্ষেপ তৈরি করে, তারা জানে না মডেলটি কোন প্রমাণকে কতটা গুরুত্ব দিচ্ছে, কী ধরনের নিরাপত্তা নিয়ম প্রয়োগ করছে, বা বিদেশি নীতি কিংবা কর্পোরেট সিদ্ধান্ত বদলালে পরিষেবাটি হঠাৎ বন্ধ হয়ে যাবে কি না।
সর্বজনীনতার ভ্রান্ত ধারণা
সার্বভৌমত্বের ফাঁকের সবচেয়ে তাৎক্ষণিক সমস্যা হলো সাংস্কৃতিক সামঞ্জস্য। পশ্চিমা মডেলগুলো প্রযুক্তিগতভাবে অত্যন্ত উন্নত, কিন্তু এগুলো মূলত “ওপেন ওয়েব”-এর ওপর প্রশিক্ষিত—যেখানে ইংরেজি ভাষা ও পশ্চিমা সংস্কৃতির আধিপত্য।
এই মডেলগুলো যখন ভারতীয় উপমহাদেশের বৈচিত্র্যময় বাস্তবতার মুখোমুখি হয়, তখন সীমাবদ্ধতা স্পষ্ট হয়ে ওঠে। এটি কেবল অনুবাদের সমস্যা নয়, বরং প্রেক্ষাপট বোঝার ব্যর্থতা। আমেরিকান আইনের ওপর প্রশিক্ষিত একটি মডেল গ্রামীণ ভারতের জমি সংক্রান্ত অলিখিত রীতিনীতি বুঝতে হিমশিম খেতে পারে। পশ্চিমা ভদ্রতার নিয়মে তৈরি একটি চ্যাটবট হিন্দি বা তামিল ভাষার জটিল সম্মানসূচক শব্দব্যবহার ঠিকভাবে সামলাতে না পেরে অজান্তেই মানুষকে আঘাত করতে পারে।
রান্নার রেসিপি জানতে চাইলে এই সাংস্কৃতিক অন্ধত্ব বিরক্তিকর হলেও সহনীয়। কিন্তু বিহারের কোনো কৃষককে ঋণ সংক্রান্ত নিয়ম বুঝিয়ে দেওয়ার কাজে এআই ব্যবহার করতে গেলে এই সীমাবদ্ধতা মারাত্মক হয়ে ওঠে। যদি এআই ব্যবহারকারীর ভাষার মিশ্রণ—হিন্দি, ইংরেজি ও স্থানীয় শব্দের কোড-সুইচিং—বুঝতে না পারে, বা ভারতীয় নিয়মের বদলে আমেরিকান আইনের ভিত্তিতে সমাধান দেয়, তবে সেটি সহায়ক নয়, বরং ঝুঁকিপূর্ণ হয়ে দাঁড়ায়।
কৌশলগত প্রয়োজন: সার্বভৌমত্ব কেন জরুরি
এই ঝুঁকিগুলো উপলব্ধি করেই বিশ্বজুড়ে দৃষ্টিভঙ্গির পরিবর্তন শুরু হয়েছে। এখন বোঝা যাচ্ছে, এআই কেবল সফটওয়্যার নয়—এটি বিদ্যুৎব্যবস্থা বা প্রতিরক্ষা ব্যবস্থার মতোই গুরুত্বপূর্ণ অবকাঠামো। এখান থেকেই জন্ম নিয়েছে “সার্বভৌম এআই” ধারণা।
ভারতের ক্ষেত্রে সার্বভৌম এআই মানে ডিজিটাল বিচ্ছিন্নতা নয়, বরং কৌশলগত স্বায়ত্তশাসন। এটি বুদ্ধিমত্তার “ভোক্তা” থেকে “স্রষ্টা” হওয়ার পথে এক বড় পদক্ষেপ। এর কারণ তিনটি—
ডেটা গোপনীয়তা ও অবস্থান: ব্যাংকিং ও স্বাস্থ্যখাতে নাগরিকদের সংবেদনশীল তথ্য বিদেশি সার্ভারে পাঠানো আইনগত ও নৈতিকভাবে প্রশ্নবিদ্ধ। নিজস্ব মডেল থাকলে ডেটা দেশের ভেতরেই, স্থানীয় আইনের অধীনে থাকে।
কৌশলগত নিরাপত্তা: প্রতিরক্ষা বা জাতীয় পেমেন্ট ব্যবস্থায় ব্যবহৃত এআইয়ের “অফ সুইচ” কোনো বিদেশি প্রতিষ্ঠানের হাতে থাকা চলবে না।
সাংস্কৃতিক নির্ভুলতা: ভারতীয় সার্বভৌম মডেল তৈরি হবে ভারতীয় বাস্তবতার জন্য—দেশের ভাষাগত বৈচিত্র্য ও ইতিহাসকে অগ্রাধিকার দিয়ে, যাতে এআই সত্যিকার অর্থে মানুষের প্রতিচ্ছবি হয়।
ফাঁকের ভেতরে প্রবেশ
এই প্রেক্ষাপটেই একটি নতুন উদ্যোগের জন্ম। ভারতীয় প্রযুক্তি খাত বুঝতে পারে, সিলিকন ভ্যালির দিকে তাকিয়ে বসে থাকলে চলবে না। পশ্চিমা প্রযুক্তি সংস্থাগুলো মূলত বৈশ্বিক গড় ব্যবহারকারীর জন্য অপ্টিমাইজ করে, যেখানে ইংরেজিভাষী পশ্চিমা বিশ্বই কেন্দ্রে থাকে। ওড়িয়া বা বাংলা উপভাষার জন্য আলাদা করে উন্নয়নে তাদের আর্থিক আগ্রহ খুব কম।
ফলে সার্বভৌমত্বের ফাঁক শুধু ঝুঁকি নয়, এক বিশাল সম্ভাবনাও তৈরি করেছিল। এই ফাঁকই দেখিয়ে দিল নতুন ধরনের একটি ফাউন্ডেশন মডেলের প্রয়োজন—যে মডেল শুধু ভারতীয় ভাষায় কথা বলবে না, বরং ভারতীয় প্রেক্ষাপটে “ভাবতে” পারবে। উপমহাদেশের জটিলতাকে ব্যতিক্রম হিসেবে নয়, মূল লক্ষ্য হিসেবেই নেবে।
এই অধ্যায় সেই পথের সূচনা করে—যেখানে দেশের ডিজিটাল কণ্ঠস্বর ফিরে পাওয়ার তাগিদ থেকেই জন্ম নেয় এক দেশীয় সমাধান।
সারভমের জন্মকথা (The Genesis of Sarvam)
বিশ্বজুড়ে কৃত্রিম বুদ্ধিমত্তার প্রতিযোগিতাকে অনেক দিন ধরেই এক ধরনের উচ্চঝুঁকির পোকার খেলার সঙ্গে তুলনা করা হয়। এখানে জয়ের শর্ত ছিল স্পষ্ট—বড় ডেটা সেন্টার, বিশাল প্যারামিটার, আর আকাশছোঁয়া বিদ্যুৎ বিল। সিলিকন ভ্যালির বিশ্বাস ছিল, যত বেশি কম্পিউটিং শক্তি, তত বেশি বুদ্ধিমত্তা। কিন্তু ২০২৩ সালের জুলাই মাসে, বেঙ্গালুরুর এক ব্যস্ত কোণে, দুই প্রযুক্তিবিদ এই পুরনো নিয়ম মানতে অস্বীকার করলেন। তারা ঠিক করলেন—এই খেলাটা হবে অন্যভাবে।
স্থপতিরা: AI4Bharat থেকে সারভম
সারভম এআই-এর গল্পটি আসলে এর প্রতিষ্ঠাতা বিবেক রাঘবন ও প্রত্যুষ কুমারের ব্যক্তিগত যাত্রার সঙ্গে গভীরভাবে জড়িত। তারা সাধারণ স্টার্টআপ উদ্যোক্তা ছিলেন না, যারা দ্রুত লাভ বা সাময়িক জনপ্রিয়তার পেছনে ছুটে বেড়ান। তাদের পরিচয় ও সহযোগিতা গড়ে ওঠে আইআইটি মাদ্রাজের গবেষণা উদ্যোগ AI4Bharat-এ, যেখানে ভারতের বিশাল ভাষাগত বৈচিত্র্যকে প্রযুক্তির মানচিত্রে তোলার কঠিন কাজ শুরু হয়েছিল।
রাঘবন ছিলেন বাস্তববাদী এক ডিজিটাল স্থপতি। কার্নেগি মেলন থেকে পিএইচডি করা এই প্রযুক্তিবিদ আধার প্রকল্পে গুরুত্বপূর্ণ ভূমিকা রেখেছিলেন। তাই তিনি ভালোভাবেই জানতেন “জনসংখ্যার স্কেলে” প্রযুক্তি তৈরি মানে কী। ভারতের মতো দেশে কোনো ব্যবস্থা তখনই সফল হয়, যখন তা শুধু শীর্ষ ১ শতাংশের জন্য নয়, বাকি ৯৯ শতাংশ মানুষের বৈচিত্র্য, বিশালতা ও বিশৃঙ্খলার মধ্যেও টিকে থাকতে পারে।
অন্যদিকে প্রত্যুষ কুমার নিয়ে এসেছিলেন গভীর একাডেমিক জ্ঞান ও প্রযুক্তিগত দূরদৃষ্টি। আইবিএম ও মাইক্রোসফট রিসার্চে কাজ করা এই গবেষক বহু বছর ধরে “টোকেনাইজেশন পেনাল্টি” নিয়ে ভাবছিলেন—যে সমস্যার কারণে হিন্দি, তামিল বা মালয়ালামের মতো ভাষা প্রক্রিয়াকরণ ইংরেজির তুলনায় বেশি ব্যয়বহুল ও ধীর হয়ে পড়ে।
দু’জনে মিলে বুঝলেন, শুধু গবেষণাপত্র লিখে ভারতীয় এআই-কে সাধারণ মানুষের কাছে পৌঁছানো সম্ভব নয়। “পরবর্তী এক বিলিয়ন ব্যবহারকারী”-এর জন্য এআইকে গণতান্ত্রিক করতে হলে দরকার দ্রুতগতির, পুঁজিবান্ধব এবং প্রচলিত নিয়ম ভাঙতে সক্ষম একটি বাণিজ্যিক উদ্যোগ। এই ভাবনা থেকেই জন্ম নিল সারভম এআই—শুধু একটি কোম্পানি নয়, বরং একটি লক্ষ্য।
দার্শনিক ভিন্নতা: বড় নয়, বরং বুদ্ধিদীপ্ত ও হালকা
সারভমের মূল দর্শন ছিল পশ্চিমা “যত বড়, তত ভালো” ধারণার সরাসরি বিরোধিতা। ওপেনএআই বা গুগলের মতো সংস্থাগুলি তৈরি করছিল বিশাল সাধারণ উদ্দেশ্যের মডেল—যেগুলি সবকিছু সম্পর্কে সামান্য জানে, ফরাসি কবিতা থেকে শুরু করে প্রোগ্রামিং কিংবা মার্কিন ইতিহাস পর্যন্ত।
সারভমের ধারণা ছিল ভিন্ন—সাধারণীকরণের চেয়ে প্রাসঙ্গিকতা বেশি জরুরি।
তাদের মতে, ভোজপুরিতে কৃষি ভর্তুকি সম্পর্কে জানতে চাওয়া এক ভারতীয় কৃষকের এমন মডেল দরকার নেই, যে শেক্সপিয়রের সনেট লিখতে পারে। তার দরকার এমন এআই, যা স্থানীয় ভাষা, কৃষিভিত্তিক বাস্তবতা ও সংশ্লিষ্ট রাজ্যের সরকারি নিয়মকানুন গভীরভাবে বোঝে।
এই ভাবনা থেকেই আসে “স্মার্ট ও লিন” পদ্ধতি। পুরো ইন্টারনেটের ওপর মডেল প্রশিক্ষণ না দিয়ে—যার বেশিরভাগই ভারতের প্রেক্ষাপটে অপ্রাসঙ্গিক—সারভম গুরুত্ব দেয় বাছাই করা, উচ্চমানের ভারত-কেন্দ্রিক ডেটাসেটে। তাদের লক্ষ্য ছিল এমন দক্ষ মডেল তৈরি করা, যা ভারতের সাধারণ এন্টারপ্রাইজ ডেটা সেন্টারের সীমিত হার্ডওয়্যারেই চলতে পারে, পশ্চিমের বিশাল সুপারক্লাস্টারের প্রয়োজন ছাড়াই।
ফুল-স্ট্যাক স্বপ্ন
শুরুর দিকেই সারভমকে আলাদা করে তুলেছিল তাদের “ফুল-স্ট্যাক” দৃষ্টিভঙ্গি। তারা শুধু একটি মডেল বানাতে চায়নি; তারা একটি সম্পূর্ণ ইকোসিস্টেম গড়তে চেয়েছিল। তাদের উপলব্ধি ছিল—ভারতে এআই মানে শুধু স্ক্রিনে একটি টেক্সট বক্স নয়। সেটিকে হতে হবে—
- ভয়েস-ফার্স্ট, যাতে সাক্ষরতার বাধা পেরিয়ে কোটি কোটি মানুষ ব্যবহার করতে পারে।
- লো-ল্যাটেন্সি, যাতে গ্রামাঞ্চলের দুর্বল ৪জি নেটওয়ার্কেও নির্বিঘ্নে কাজ করে।
- খরচ-সাশ্রয়ী, কারণ সীমিত মুনাফার ভারতীয় ব্যবসায় কম খরচই বাস্তবসম্মত সমাধান।
তাদের লক্ষ্য ছিল ভারতের জন্য এআই-এর “অ্যান্ড্রয়েড” তৈরি করা—এমন এক সর্বব্যাপী বুদ্ধিমত্তার স্তর, যা শিক্ষার্থীর টিউটর বট থেকে শুরু করে ব্যাংকের ঋণ প্রক্রিয়াকরণ ব্যবস্থায় শক্তি জোগাবে। এটি সিলিকন ভ্যালির সঙ্গে প্রতিযোগিতার প্রশ্ন ছিল না; বরং ভারতীয় বাজারে পশ্চিমা “একই মাপ সবার জন্য” ধারণাকে অপ্রাসঙ্গিক করে তোলাই ছিল উদ্দেশ্য।
এই পথে হাঁটতে গিয়ে সারভম শুধু একটি কোম্পানি গড়েনি। তারা বিশ্বব্যাপী এআই-এর গতিপথ নিয়ে একটি প্রশ্ন ছুড়ে দিয়েছে—যেখানে বৈচিত্র্য ও বাস্তবতার জটিলতায় ভরা গ্লোবাল সাউথে, শেষ পর্যন্ত কাঁচা কম্পিউটিং শক্তির চেয়ে সাংস্কৃতিক নির্ভুলতাই জয়ী হবে।
Sarvam-Large-এর উন্মোচন
বেঙ্গালুরুর কোরামাঙ্গালা এলাকার ভরা অডিটোরিয়ামের ভেতরের পরিবেশে তখন এক ধরনের চাপা উত্তেজনা কাজ করছিল—এক ভাগ প্রত্যাশা, তার সঙ্গে দ্বিগুণ সংশয়। সময়টা ২০২৫ সালের শেষ দিক। বিশ্বজুড়ে তখন “এআই ক্লান্তি” স্পষ্ট। অসংখ্য স্টার্টআপ একের পর এক “GPT-কিলার” আনার প্রতিশ্রুতি দিয়েছিল, কিন্তু বাস্তবে সেগুলোর বেশিরভাগই পশ্চিমা প্রযুক্তির সামান্য রূপান্তর ছাড়া আর কিছু ছিল না।
আলো নিভে যাওয়ার সঙ্গে সঙ্গে শিল্প বিশ্লেষকদের মনে একটাই সরাসরি প্রশ্ন ঘুরছিল—সিলিকন ভ্যালির তুলনায় অনেক কম বাজেটে কাজ করা ভারতীয় প্রকৌশলীদের একটি দল কি সত্যিই শূন্য থেকে একটি মৌলিক মডেল তৈরি করতে পারবে? নাকি এটাও শুধু Meta-এর Llama-এর আরেকটি ফাইন-টিউন সংস্করণ, জাতীয়তাবাদী মোড়কে সাজানো?
উন্মোচনের মুহূর্ত: এক প্রযুক্তিগত স্বাধীনতার ঘোষণা
সহ-প্রতিষ্ঠাতা বিবেক রাঘবন ও প্রত্যুষ কুমার যখন মঞ্চে এলেন, তারা কেবল একটি পণ্য ঘোষণা করলেন না; তারা একটি বড় পরিবর্তনের ইঙ্গিত দিলেন। মঞ্চের পেছনের পর্দায় ভেসে উঠল দুটি শব্দ—Sarvam-Large।
এটি কোনো মোড়কবদ্ধ প্রযুক্তি নয়। এটি ছিল ৭০ বিলিয়ন প্যারামিটারের এক বিশাল মডেল, যা সম্পূর্ণভাবে ভারতীয় মাটিতে নকশা করা, প্রশিক্ষিত এবং সমন্বিত।
প্রথম লাইভ ডেমো শুরু হতেই হলঘরের নীরবতা ভাঙল। যুক্তরাষ্ট্রের বড় প্রযুক্তি সংস্থাগুলোর মতো ঝকঝকে, আগেভাগে প্রস্তুত ডেমোর বদলে এটি ছিল একেবারে বাস্তব। মারাঠি ও ইংরেজির দ্রুত মিশ্রণে একটি সরাসরি ভয়েস প্রশ্ন করা হলো—মহারাষ্ট্রের একটি নির্দিষ্ট আইনের অধীনে জমির রেকর্ড যাচাই সংক্রান্ত জটিল প্রশ্ন।
পশ্চিমা মডেলগুলো সাধারণত এমন প্রশ্নে হোঁচট খেত, কখনো মার্কিন সম্পত্তি আইন কল্পনা করত, কখনো মারাঠি শব্দগুলোকে অর্থহীন ইংরেজিতে রূপান্তর করত। Sarvam-Large কেবল অনুবাদ করেনি; এটি যুক্তি করেছে। মডেলটি সাবলীল মারাঠিতে উত্তর দিয়েছে, সঠিকভাবে ৭/১২ এক্সট্র্যাক্ট পদ্ধতির উল্লেখ করেছে এবং আরও নির্ভুল তথ্যের জন্য ব্যবহারকারীর জেলার নাম জানতে চেয়েছে।
প্রযুক্তির অন্তরালে: শক্তি ও যুক্তি
এরপর যখন প্রযুক্তিগত বিশদ তুলে ধরা হলো, সংশয় দ্রুতই মিলিয়ে গেল। Sarvam-Large ছিল IndiaAI Mission-এর ফল—একটি কৌশলগত সরকারি উদ্যোগ, যা অবশেষে বাস্তব সাফল্যে পরিণত হয়েছে।
কম্পিউট শক্তি: এই মডেলটি ভার্জিনিয়া বা ফ্র্যাঙ্কফুর্টের ভাড়াকৃত সার্ভারে প্রশিক্ষিত হয়নি। এটি তৈরি হয়েছে ভারতের নিজস্ব সার্বভৌম ডেটা সেন্টারে স্থাপিত ৪,০০০ NVIDIA H100 GPU-এর ওপর। এত বড় পরিসরে “কম্পিউট সার্বভৌমত্ব” এই প্রথম বাস্তবে দেখা গেল।
স্থাপত্য: বিশ্ব যখন “Mixture of Experts (MoE)” আর্কিটেকচারের দিকে ঝুঁকছিল, Sarvam-Large বেছে নিয়েছে ভাষাগত ঘনত্বের জন্য অপ্টিমাইজড একটি নতুন নকশা। এখানে ভারতীয় ভাষাগুলোকে আর “লো-রিসোর্স” হিসেবে দেখা হয়নি। প্রশিক্ষণ টোকেনের প্রায় ৫০% দেওয়া হয়েছে ভারতীয় লিপি ও ভাষার জন্য—যা GPT-4o-এর মতো মডেলে গড়ে ২%-এরও কম।
দক্ষতা: সবচেয়ে উল্লেখযোগ্য বিষয় হলো, এই মডেলটি গ্লোবাল সাউথের সীমাবদ্ধ বাস্তবতাকে মাথায় রেখে তৈরি। স্থানীয় ভাষায় এটি GPT-4 মানের পারফরম্যান্স দিলেও, ইনফারেন্সের জন্য অনেক কম কম্পিউট শক্তি প্রয়োজন। ফলে বিশাল ক্লাউড ক্লাস্টারের বদলে এটি সরাসরি সরকারি অন-প্রিমাইস সার্ভারেই চালানো সম্ভব।
ভারতের “DeepSeek মুহূর্ত”
শিল্প মহলে দ্রুতই এটিকে চীনের “DeepSeek মুহূর্ত”-এর সঙ্গে তুলনা করা হলো—যেখানে দক্ষতা ও সাংস্কৃতিক উপযোগিতাই আমেরিকান আধিপত্যের ধার ভেঙে দিয়েছিল।
ব্যাংকিং খাতের শীর্ষ কর্মকর্তা ও সরকারি সচিবদের কাছে এই উন্মোচন ছিল স্বস্তির বার্তা। অবশেষে তাদের হাতে এলো একটি সত্যিকারের “সার্বভৌম” বিকল্প। এমন একটি এআই, যেখানে সংবেদনশীল আর্থিক ও নাগরিক তথ্য দেশের আইনি সীমার মধ্যেই থাকবে, বাইরের নীতিগত পরিবর্তনের প্রভাবমুক্ত।
প্রেজেন্টেশনের শেষে এসে গল্পটা পুরো বদলে গেল। Sarvam-Large আর শুধু একটি নতুন মডেল নয়—এটি ভারতের “ডিজিটাল পোখরান”। এক চূড়ান্ত সক্ষমতার প্রমাণ, যা দেখিয়ে দিল—ভারত আর শুধু এআই-এর বাজার নয়, এআই-এর নির্মাতাও।
ডেটাসেটের সুবিধা
যদি কম্পিউট শক্তি একটি এআই মডেলের ইঞ্জিন হয়, তবে ডেটা হলো তার জ্বালানি। বহু বছর ধরে এই জ্বালানির বৈশ্বিক মানদণ্ড ছিল “কমন ক্রল”—ইন্টারনেট থেকে নির্বিচারে সংগ্রহ করা বিশাল ডেটার ভাণ্ডার। ইংরেজি ভাষার ক্ষেত্রে এটি বেশ কার্যকর, কারণ ওয়েবের প্রায় ৬০ শতাংশই ইংরেজিতে। কিন্তু বিশ্বের বাকি অংশের জন্য এতে তৈরি হয় বড় এক অন্ধ জায়গা। ভারতের মতো দেশের ক্ষেত্রে কমন ক্রল আসলে একটি লাইব্রেরির চেয়ে বেশি বিকৃত আয়নার মতো—অসম্পূর্ণ, বিকৃত এবং নিম্নমানের মেশিন অনুবাদে ভরা।
Sarvam AI শুরুতেই বুঝে গিয়েছিল যে শুধু ওয়েব স্ক্র্যাপিং করে তারা প্রযুক্তিগত সার্বভৌমত্ব পাবে না। ভারতের বাস্তবতা বুঝতে হলে তাদের যেতে হবে সেখানে, যেখানে সাধারণ ক্রলার পৌঁছায় না—অফলাইনে, আর্কাইভে, আর গভীরভাবে আঞ্চলিক ভাষার ভেতরে।
“ওয়েব”-এর সীমাবদ্ধতা
পশ্চিমা এআই মডেলগুলোর মূল সমস্যা হলো—প্রাসঙ্গিকতার চেয়ে পরিমাণকে বেশি গুরুত্ব দেওয়া। যুক্তরাষ্ট্রভিত্তিক কোনো মডেল যখন খোলা ইন্টারনেটে হিন্দি বা তামিল লেখা পড়ে, তখন বেশিরভাগ সময়ই সেটি “SEO স্প্যাম”—ইংরেজি থেকে স্বয়ংক্রিয়ভাবে অনুবাদ করা বিপণনমূলক লেখা। এতে ভাষার আত্মা নেই, নেই বাগধারা বা সাংস্কৃতিক প্রেক্ষাপট।
Sarvam এই “জাঙ্ক ফুড” ধরনের ওয়েব ডায়েট প্রত্যাখ্যান করেছিল। তার বদলে তারা বেছে নিয়েছিল পুষ্টিকর পথ—একটি “সার্বভৌম কর্পাস” তৈরি করা। এটি কেবল ডেটা ইঞ্জিনিয়ারিংয়ের কাজ ছিল না; এটি ছিল এক ধরনের ডিজিটাল প্রত্নতত্ত্ব।
মহান ভারতীয় ডেটা অনুসন্ধান
এই কাজের জন্য দলটি এমন অংশীদারিত্ব গড়ে তোলে, যা কম্পিউটার সায়েন্সের চেয়ে মানববিদ্যার প্রকল্পের মতো মনে হয়। তারা ভারতের প্রাচীন প্রকাশনা সংস্থা, বিশ্ববিদ্যালয় ও মিডিয়া আর্কাইভের সঙ্গে কাজ করে কাগজে বন্দি থাকা জ্ঞানকে ডিজিটাল রূপ দেয়।
সরকারি আর্কাইভ: ভারতের প্রশাসনিক কাঠামো কাগজপত্রের জন্য বিখ্যাত। Sarvam লক্ষ লক্ষ সরকারি আদেশ, আইনি গেজেট ও সংসদীয় বিতর্ক সংগ্রহ করে। এগুলো ভাষার পাশাপাশি যুক্তি শেখাতেও জরুরি ছিল—ভারতীয় শাসনব্যবস্থা কীভাবে চিন্তা করে, তা বোঝাতে।
আঞ্চলিক সাহিত্য: ভারতীয় ভাষার সৌন্দর্য ও ছন্দ ধরতে দলটি কপিরাইট-মুক্ত আধুনিক ও শাস্ত্রীয় সাহিত্যের ভাণ্ডার ব্যবহার করে। এতে মডেলটি কেবল দাপ্তরিক ভাষায় কথা বলা শেখেনি; উর্দু কবিতার সূক্ষ্মতা বা মারাঠি নাটকের তীক্ষ্ণ রসবোধও বুঝতে পেরেছে।
মৌখিক ইতিহাস ও ট্রান্সক্রিপ্ট: ভারত মূলত একটি মৌখিক সংস্কৃতি। তাই রেডিও অনুষ্ঠান, পডকাস্ট ও সংবাদ বুলেটিনের ট্রান্সক্রিপ্ট যুক্ত করা হয়। এতে মডেলটি বুঝতে শেখে মানুষ বাস্তবে কীভাবে কথা বলে—অনানুষ্ঠানিক, প্রবাহমান ও কথ্য ভাষায় ভরা।
“ক্লিনিং”-এর দুঃস্বপ্ন
ডেটা সংগ্রহ ছিল যুদ্ধের অর্ধেক। আসল লড়াই ছিল ডেটা “পরিষ্কার” করার ধাপে। ইংরেজি ডেটা তুলনামূলকভাবে গোছানো—শব্দের মাঝে স্পেস, ব্যাকরণ মোটামুটি একরকম। ভারতীয় ডেটা তার ঠিক উল্টো—অগোছালো হলেও জীবন্ত।
লিপির জটিলতা: দেবনাগরী বা দ্রাবিড় লিপিতে যুক্তাক্ষর ও স্বরচিহ্নের জটিল ব্যবহার রয়েছে। সামান্য এনকোডিং ভুলেই অর্থপূর্ণ শব্দ অর্থহীন হয়ে যেতে পারে।
PDF-এর কবরস্থান: ভারতের বহু ডিজিটাল ইতিহাস স্ক্যান করা PDF-এ বন্দি, যেখানে ইউনিকোড-পূর্ব পুরনো ফন্ট (যেমন Kruti Dev) ব্যবহৃত হয়েছে। এই লেখা উদ্ধার করতে Sarvam-কে নিজস্ব OCR পাইপলাইন তৈরি করতে হয়েছে।
হিংলিশের মিশ্রণ: সবচেয়ে কঠিন ছিল রোমান ও ভারতীয় লিপির মিশ্রণ। এক বাক্যে ইংরেজি ব্যাকরণ, কিন্তু হিন্দি শব্দ ইংরেজি অক্ষরে লেখা। সাধারণ ফিল্টার এগুলোকে “আবর্জনা” ভেবে মুছে ফেলত। Sarvam বিশেষ ফিল্টার বানায়, যা এটিকে শব্দদূষণ নয়, আধুনিক ভারতীয় ইন্টারনেট ব্যবহারকারীর আসল কণ্ঠস্বর হিসেবে চিনতে পারে।
শব্দদূষণ থেকে সূক্ষ্মতা
এই শ্রমসাধ্য প্রক্রিয়ার ফল ছিল এমন একটি ডেটাসেট, যা GPT-4-এর প্রশিক্ষণ ডেটার তুলনায় আকারে ছোট হলেও সাংস্কৃতিক সংকেতে অনেক বেশি ঘন।
এই উচ্চমানের ডেটা দিয়ে Sarvam-Large এমন জিনিস শিখেছে, যা কেবল কোড লিখে শেখানো যায় না। মডেলটি বুঝেছে “চাক্কা জ্যাম” কোনো ফলের সংরক্ষণ নয়, বরং রাস্তা অবরোধের প্রতিবাদ। বুঝেছে “শুভ চিন্তক” মানে শুধু ভালো চিন্তাবিদ নয়, একটি নির্দিষ্ট সামাজিক অর্থবোধক শুভাকাঙ্ক্ষী।
এই ডেটাসেটের সুবিধাই Sarvam-এর আসল শক্তি হয়ে ওঠে। প্রতিযোগীরা GPU কিনতে পারে, প্রকৌশলী নিয়োগ দিতে পারে—কিন্তু বছরের পর বছর ধরে গড়ে ওঠা সম্পর্ক আর ডিজিটাল খননের এই ইতিহাস সহজে নকল করতে পারে না। ভারতের বিশৃঙ্খল তথ্যভূমির “শব্দদূষণ”কে তারা রূপান্তর করেছে ভাষাগত বুদ্ধিমত্তার এক সোনার খনিতে।
খিচুড়ি” আয়ত্ত করা — কোড-সুইচিং ইঞ্জিন
পশ্চিমা শিক্ষাঙ্গনের চকচকে করিডোরে ভাষাকে সাধারণত আলাদা ও বিশুদ্ধ সত্তা হিসেবে দেখা হয়। আপনি ইংরেজি বা ফরাসি বলেন। আপনি Python বা C++-এ কোড লেখেন। কিন্তু মুম্বাইয়ের রাস্তা, কলকাতার চায়ের দোকান কিংবা দিল্লির হোয়াটসঅ্যাপ গ্রুপে ভাষা এমন নয়। সেখানে ভাষা এক ধরনের খিচুড়ি—ব্যাকরণ ও শব্দভান্ডারের এমন এক মিশ্রণ, যা কোনো সহজ শ্রেণিবিভাগ মানে না।
ভারতের বাস্তবতা হলো কোড-সুইচিং—একটি বাক্যের মধ্যেই স্বচ্ছন্দে ভাষা বদলে ফেলা। একজন ব্যাংক ম্যানেজার বলেন না, “Did you receive the document?” তিনি বলেন, “Document mil gaya kya? Check karlo.”
দীর্ঘদিন ধরে এই ভাষাগত মিশ্রণই ছিল পশ্চিমা এআই মডেলগুলোর দুর্বলতা। মানসম্মত ইংরেজি ও আনুষ্ঠানিক অনুবাদে প্রশিক্ষিত GPT-4-এর মতো মডেলের কাছে কোড-সুইচিং মানে ছিল শব্দদূষণ। কিন্তু Sarvam-Large-এর কাছে এটি মাতৃভাষার মতো স্বাভাবিক।
টোকেনাইজার ট্যাক্স: কেন পশ্চিমা মডেলগুলো হোঁচট খায়
Sarvam-Large কেন অন্যদের ছাড়িয়ে যায়, তা বুঝতে হলে বড় ভাষা মডেলের সবচেয়ে ছোট একক—টোকেন—নিয়ে কথা বলতে হয়।
মডেল শব্দ পড়ে না; সে পড়ে অক্ষরের ছোট ছোট অংশ, যাদের বলা হয় টোকেন। পশ্চিমা টোকেনাইজারগুলো ইংরেজির জন্য অপ্টিমাইজড। তারা “Constitution”-এর মতো দীর্ঘ শব্দকে একটিমাত্র টোকেন হিসেবেই ধরতে পারে। কিন্তু “Nandri” (তামিল ভাষায় ধন্যবাদ) বা “Swagat”-এর মতো ভারতীয় শব্দের মুখোমুখি হলে তারা ভেঙে পড়ে।
এই শব্দগুলোকে তারা ৫-৬ বা তারও বেশি অর্থহীন অংশে ভেঙে ফেলে। একেই বলা হয় “টোকেনাইজার ট্যাক্স”।
খরচ বাড়ে: একটি শব্দ যত বেশি টোকেনে ভাঙে, তত বেশি কম্পিউটেশন লাগে। অর্থাৎ ভারতীয় ব্যবহারকারীদের জন্য এআই ব্যবহার কার্যত বেশি ব্যয়বহুল হয়ে ওঠে।
অর্থ হারায়: শব্দ টুকরো টুকরো হলে তার মূল অর্থও ঝাপসা হয়ে যায়। “Swagat” তখন আর স্বাগত জানানোর ধারণা নয়, বরং এলোমেলো অক্ষরের সারি—মডেলকে তখন প্রেক্ষাপট দেখে আন্দাজ করতে হয়।
এই সমস্যার সমাধান Sarvam-Large করেছে একেবারে শুরু থেকে নতুন টোকেনাইজার বানিয়ে। ইঞ্জিনিয়াররা ৪০,০০০-এর বেশি আলাদা ভারতীয় টোকেন যুক্ত করেছেন। ফলে “Swagat” একটি টোকেন, “Nandri”-ও একটি টোকেন। এতে ভারতীয় ভাষার জন্য টোকেনের “ফার্টিলিটি রেট” ৪:১ থেকে নেমে এসেছে প্রায় ১.৪:১-এ—ইংরেজির কাছাকাছি।
“ইনটেন্ট” ইঞ্জিন
তবে আসল সাফল্য শুধু শব্দ পড়ায় নয়, উদ্দেশ্য বোঝায়।
পশ্চিমা মডেলগুলো প্রায়ই মিশ্র ভাষার প্রশ্নকে অনুবাদের সমস্যা হিসেবে দেখে। কেউ লিখলে—“Account freeze ho gaya hai”—সাধারণ মডেল আগে এটাকে ইংরেজিতে অনুবাদ করে, তারপর বোঝার চেষ্টা করে।
Sarvam-Large অনুবাদ এড়িয়ে যায়। লক্ষ লক্ষ ঘণ্টার ভারতীয় কথোপকথন ও চ্যাট ডেটায় প্রশিক্ষিত হওয়ায়, সে জানে “freeze ho gaya” মানে একটি নির্দিষ্ট আর্থিক অবস্থা।
“খিচুড়ি” পরীক্ষা: অভ্যন্তরীণ পরীক্ষায় মডেলকে দেওয়া হয় এই পরিচিত প্রশ্ন—
“Sir, maine UPI payment kiya tha but paise kat gaye aur merchant ko nahi mila. Dispute raise karna hai.”
GPT-4o কী করে: ইংরেজি শব্দগুলো ঠিকঠাক ধরে, কিন্তু “paise kat gaye”-এর মতো হিন্দি ক্রিয়ায় প্রায়ই বিভ্রান্ত হয়—কখনো এটাকে আক্ষরিক কাটাকাটি ভেবে ফেলে।
Sarvam-Large কী করে: সঙ্গে সঙ্গে বোঝে, “paise kat gaye” মানে টাকা ডেবিট হয়েছে, কিন্তু ক্রেডিট হয়নি। সে অনুবাদ না করে সরাসরি ব্যাংকিং সিস্টেমের “Transaction Failure” প্রক্রিয়া চালু করে এবং স্বচ্ছন্দ হিংলিশে উত্তর দেয়—
“Chinta mat kariyega. Transaction ID share karein, main abhi status check kar leta hoon.”
হিংলিশের বাইরে: বাংলিশ ও তাংলিশ
এই “খিচুড়ি” ইঞ্জিন শুধু হিন্দিতে সীমাবদ্ধ নয়। মডেলটি বাংলিশ (ইংরেজি অক্ষরে বাংলা) ও তাংলিশ (ইংরেজি অক্ষরে তামিল)-এও সমান দক্ষ।
এর জন্য ব্যবহার করা হয়েছে “স্ক্রিপ্ট-অ্যাগনস্টিক এমবেডিং” পদ্ধতি। এতে মডেল শেখে যে তামিল শব্দ “Vanakkam” তামিল লিপিতে লেখা হোক বা ইংরেজি অক্ষরে—দুটোর অর্থ একই। মডেলের “মস্তিষ্কে” এই দুই রূপ একই জায়গায় বসে।
ফলে ব্যবহারকারী চাইলে ইংরেজিতে শুরু করে, মাঝখানে তামিল লিপিতে লিখে, শেষে ইংরেজি স্ল্যাং যোগ করতে পারেন—মডেল একটুও থেমে যায় না।
খিচুড়ি আয়ত্ত করে Sarvam কেবল উন্নত স্পেল-চেকার বানায়নি। তারা এমন একটি মডেল বানিয়েছে, যা ব্যবহারকারীকে সম্মান করে। তারা বুঝেছে—ভারতে ভাষা মেশানো কোনো দুর্বলতা নয়; বরং আধুনিক দক্ষতার স্বাভাবিক প্রকাশ।
দ্য বেঞ্চমার্ক ব্যাটল: সারভম বনাম দ্য ওয়ার্ল্ড
কৃত্রিম বুদ্ধিমত্তার জগতে বেঞ্চমার্কই হলো যুদ্ধক্ষেত্র। বহু মাস ধরে এই শিল্পখাতের নিয়ন্ত্রণ ছিল তথাকথিত “বিগ থ্রি”—ওপেনএআই, গুগল এবং অ্যানথ্রোপিকের হাতে। তারা একে অপরের সঙ্গে প্রতিযোগিতায় নেমেছিল এমএমএলইউ (Massive Multitask Language Understanding)–এর মতো লিডারবোর্ডে। এসব পরীক্ষা মূলত পশ্চিমা গবেষকদের তৈরি, যেখানে পশ্চিমা যুক্তিবোধকেই মানদণ্ড ধরা হয়।
এই ময়দানে যখন Sarvam-Large প্রবেশ করল, তখন সে শুধু বিদ্যমান লিডারবোর্ডে ওপরে ওঠার চেষ্টা করেনি; বরং গোটা শিল্পকে বাধ্য করেছে একেবারে নতুন একটি স্কোরবোর্ডের দিকে তাকাতে। ফলাফল ছিল না সম্পূর্ণ একতরফা জয়, বরং এক ধরনের হিসেবি অসমতা। Sarvam-Large–কে এমনভাবে বানানো হয়নি যে সে সব বিষয়ে GPT-4o–এর চেয়ে ভালো হবে; তাকে বানানো হয়েছে ভারতকে ভালোভাবে বোঝার জন্য।
দুইটি লিডারবোর্ডের গল্প
তুলনামূলক বিশ্লেষণে উঠে এসেছে এক ক্লাসিক “ডেভিড বনাম গোলিয়াথ” চিত্র—যেখানে শক্তির চেয়ে বিশেষায়নই মূল নির্ধারক।
১. সাধারণ যুক্তিবোধ (গোলিয়াথের এলাকা):
পশ্চিমা মানদণ্ডে তৈরি বেঞ্চমার্কে—যেমন পাইথন কোডিং, জিআরই স্তরের যুক্তির ধাঁধা, কিংবা ইংরেজিতে সৃজনশীল লেখা—GPT-4o তার শীর্ষস্থান ধরে রেখেছে। বিশাল আকার ও বৈশ্বিক ইন্টারনেট ডেটায় প্রশিক্ষণের কারণে এই মার্কিন মডেলটি বিমূর্ত ও সাধারণ যুক্তিতে এগিয়ে। নিউ ইয়র্ককে পটভূমি করে চিত্রনাট্য লেখা হোক বা জটিল C++ কার্নেল ডিবাগ করা—এসব কাজে GPT-4o এখনো নিরঙ্কুশ রাজা।
২. ইন্ডিক সুইপ (ডেভিডের জয়):
কিন্তু যখন দৃষ্টিভঙ্গি বদলে এয়ারাবত ও ইন্ডিকসেন্ট বেঞ্চমার্কে আনা হলো—যেগুলো বিশেষভাবে দক্ষিণ এশীয় ভাষার জন্য তৈরি—তখন পরিস্থিতি শুধু বদলায়নি, পুরো উল্টে গেছে।
- টোকেন দক্ষতা: মালয়ালম ও তেলুগুর মতো ভাষায় Sarvam-Large, GPT-4o–এর তুলনায় প্রায় তিন গুণ দ্রুত প্রশ্ন প্রক্রিয়া করেছে। কারণ এই ভাষাগুলোকে সে “বিদেশি” নয়, “নিজের” ভাষা হিসেবেই ধরে নিয়েছে।
- সূক্ষ্মতা বোঝার ক্ষমতা: “Cultural Commonsense” বেঞ্চমার্কে Sarvam-Large আঞ্চলিক প্রেক্ষাপট শনাক্ত করতে ৯২% নির্ভুলতা দেখিয়েছে, যেখানে GPT-4o পেয়েছে মাত্র ৬৮%।
“ওডিয়া” পরীক্ষা: ব্যর্থতা ও সাফল্যের একটি উদাহরণ
এই পার্থক্য বোঝাতে বিশ্লেষকেরা ওডিয়া ভাষার একটি নির্দিষ্ট পরীক্ষার কথা উল্লেখ করেন। প্রায় ৪ কোটির বেশি মানুষ এই ভাষায় কথা বলেন, কিন্তু পশ্চিমা ডেটাসেটে এটি দীর্ঘদিন ধরেই অবহেলিত।
প্রশ্নটি ছিল ওড়িশা ভূমি সংস্কার আইন সংক্রান্ত একটি জটিল আইনি জিজ্ঞাসা, যেখানে আনুষ্ঠানিক আইনি ভাষা ও গ্রামীণ উপভাষার মিশ্রণ ছিল।
- GPT-4o–এর উত্তর: মডেলটি সুন্দরভাবে “হ্যালুসিনেশন” করেছে। ওডিয়ায় ব্যাকরণগতভাবে সঠিক উত্তর দিলেও, সেখানে ওড়িশা রাজ্যের নির্দিষ্ট ভূমি সংস্কার আইনের বদলে ভারতের চুক্তি আইন উদ্ধৃত করেছে। শুনতে আত্মবিশ্বাসী হলেও আইনগতভাবে এটি বিপজ্জনক।
- Sarvam-Large–এর উত্তর: এটি শুধু সঠিক ধারাই উল্লেখ করেনি, বরং “আদিবাসী জমি হস্তান্তর” সংক্রান্ত প্রশ্নে সম্ভাব্য অস্পষ্টতাও তুলে ধরেছে। অর্থাৎ, এটি শুধু লেখা পড়েনি—আইনি ক্ষেত্রটি বুঝেছে।
অনুবাদের বাইরে: সাংস্কৃতিক যুক্তি
সবচেয়ে বড় পার্থক্য দেখা গেছে “সাংস্কৃতিক যুক্তি”তে—অর্থাৎ, কথার আক্ষরিক মানে নয়, আসল ইঙ্গিত বোঝার ক্ষমতায়।
মারাঠিতে একটি কাস্টমার সার্ভিস অভিযোগের পরীক্ষায় ব্যবহারকারী বলেছিল, “ভাত শিজলা” (bhaat shijla)।
- পশ্চিমা মডেলগুলো: এটিকে সরাসরি রান্নার অবস্থা বা বড়জোর “কাজ শেষ”–এর রূপক হিসেবে ব্যাখ্যা করেছে।
- Sarvam-Large: পুনে অঞ্চলের কথ্য ভাষায় ব্যবহৃত ব্যঙ্গাত্মক অর্থটি সঠিকভাবে ধরেছে—যার মানে “সব গণ্ডগোল হয়ে গেছে”। তাই সে সহমর্মিতা ও পরিস্থিতি সামাল দেওয়ার উপযুক্ত উত্তর দিয়েছে।
চূড়ান্ত রায়: সার্বভৌমত্বই একটি ফিচার
এই বেঞ্চমার্ক লড়াই প্রমাণ করেছে যে “বুদ্ধিমত্তা” কোনো একমুখী, সোজা রেখা নয়। এটি বিস্তৃত ও প্রেক্ষাপটনির্ভর।
বিশ্বব্যাপী কোনো প্রতিষ্ঠানের জন্য কোড লেখার কাজে GPT-4o এখনো সোনার মানদণ্ড। কিন্তু কোনো ভারতীয় ব্যাংক, রাজ্য সরকার বা গ্রামীণ স্বাস্থ্য পরিষেবার জন্য Sarvam-Large এমন কিছু দেয়, যা বৃহৎ মডেলগুলো দিতে পারে না—নির্ভরযোগ্যতা।
Sarvam তার নির্মাতাদের কাছে গুরুত্বপূর্ণ লড়াইটিই জিতেছে। সে দেখিয়ে দিয়েছে, পৃথিবীর সমস্যার সমাধানে গ্যালাক্সির মতো বিশাল মডেলের দরকার নেই—দরকার শুধু এমন এক মডেল, যে নিজের ভূখণ্ডকে ভালোভাবে চেনে।
ভারতের ওপর ভরসা: ফিনটেক বিপ্লব
গত এক দশকে ভারতের আর্থিক ব্যবস্থার গল্প মূলত একটি শব্দের চারপাশেই ঘুরেছে—ইউপিআই (Unified Payments Interface)। এই প্রযুক্তি অর্থ লেনদেনের ধরনটাই বদলে দিয়েছে। স্মার্টফোন থাকা মানেই যেন পকেটে একটি ডিজিটাল ব্যাংক। কিন্তু আর্থিক লেনদেনের অবকাঠামো ডিজিটাল হলেও, ব্যাংকিং–এর ভাষা ও কথোপকথন রয়ে গেছে অনেকটাই পুরোনো ও জটিল।
মধ্যপ্রদেশের কোনো গ্রামে বসবাসকারী একজন কৃষকের হাতে ব্যাংকিং অ্যাপ থাকতে পারে। কিন্তু সেই অ্যাপ যদি ইংরেজিতে হয়, বা বইয়ের ভাষার কঠিন হিন্দিতে লেখা হয়, তাহলে সেটি তার কাছে তালাবদ্ধ ভল্টের মতোই অকেজো। তখন তাকে বহু দূরের ব্যাংক শাখায় যেতে হয়, লাইনে দাঁড়াতে হয়, আর সবকিছু বোঝার জন্য একজন মানুষের ওপর নির্ভর করতে হয়।
এই জায়গাতেই Sarvam-Large সবচেয়ে গুরুত্বপূর্ণ ভূমিকা নিয়েছে। এটি শুধু চ্যাটবট চালাচ্ছে না; এটি ব্যাংকিং ব্যবস্থার ওপর চাপিয়ে দেওয়া “সাক্ষরতার কর” ভেঙে দিচ্ছে।
এক দিনের গল্প: রাম সিংয়ের ঋণ
এই পরিবর্তন বোঝার জন্য ধরা যাক রাম সিংয়ের কথা। তিনি বেতুল জেলার একজন সয়াবিন চাষি। Sarvam-এর আগের সময়ে, তার কিষান ক্রেডিট কার্ড (KCC) নবীকরণের অবস্থা জানতে হলে একদিনের মজুরি ছেড়ে কাছের ব্যাংকে যেতে হতো। সেখানে লাইনে দাঁড়িয়ে থেকেও হয়তো শুনতে হতো—“কাল আসুন।”
আজ পরিস্থিতি সম্পূর্ণ আলাদা।
রাম সিং তার ব্যাংকের হোয়াটসঅ্যাপ চ্যানেল খুলে। কম গতির ৪জি নেটেও এটি ভালোভাবে চলে। তিনি মাইক্রোফোন বাটন চাপেন। কোনো যান্ত্রিক কমান্ডে কথা বলেন না। নিজের স্বাভাবিক বান্দেলি উপভাষায়, মানুষের মতো করেই বলেন—
“আরে ভাই, গত সপ্তাহে যে কাগজগুলো লোনের জন্য দিয়েছিলাম, সেগুলোর কী হলো? বোনির সময় এসে গেছে।”
বিশ্বাসের সেতু
এই একটি প্রশ্নের মধ্যেই শুরু হয় এক জটিল কিন্তু অদৃশ্য প্রক্রিয়া, যেখানে Sarvam-Large একটি বিশ্বাসের সেতু হিসেবে কাজ করে।
শব্দ বোঝা:
প্রথমেই মডেলটি গ্রামের পটভূমির শব্দ ছেঁকে বান্দেলি উপভাষা শনাক্ত করে। এটি সাধারণ হিন্দি থেকে আলাদা—এই সূক্ষ্ম পার্থক্য সে ঠিকভাবে ধরে ফেলে।
উদ্দেশ্য বোঝা:
সাধারণ কোনো বিদেশি মডেল হয়তো “কাগজ” শব্দটিকে আক্ষরিক অর্থে নিত, বা “বোনি” শব্দটির সঙ্গে সময়ের চাপের সম্পর্ক বুঝত না। কিন্তু Sarvam-Large জানে—এটি বপনের মৌসুমের আগে ঋণ ছাড় নিয়ে দুশ্চিন্তার কথা।
নিয়ম ও তথ্য যাচাই:
এরপর মডেলটি ব্যাংকের মূল ব্যাংকিং সিস্টেম থেকে তথ্য নেয়। শুধু একটি স্ট্যাটাস কোড নয়—ছুটি, প্রসেসিং সময়, সবকিছু মিলিয়ে দেখে।
মানুষের মতো উত্তর:
সবশেষে, ঠান্ডা ভাষায় “আবেদন প্রক্রিয়াধীন” না বলে, একই উপভাষায় ভয়েস নোটে উত্তর দেয়—
“রাম সিং জি, চিন্তা করবেন না। আপনার কাগজপত্র যাচাই হয়ে গেছে। পরশু দিনের মধ্যেই টাকা আপনার অ্যাকাউন্টে চলে আসবে। বোনির দেরি হবে না।”
নির্ভুলতাই নিরাপত্তা
ব্যাংকিংয়ে “প্রায় ঠিক” বলে কিছু নেই। যদি কোনো এআই ভুল ব্যালান্স বলে দেয় বা ভুল নিয়ম বানিয়ে ফেলে, তার ফল হতে পারে বড় আইনি ও আর্থিক ক্ষতি।
এই কারণেই অনেক ভারতীয় ব্যাংক বৈশ্বিক মডেলের বদলে Sarvam-Large–এর ওপর ভরসা করছে। স্থানীয় প্রশ্নে বিভ্রান্ত হলে বিদেশি মডেল প্রায়ই “ভদ্রভাবে ভুল” উত্তর দেয়। যেমন, পিএম-কিষান প্রকল্প নিয়ে প্রশ্ন করলে তারা কখনো মার্কিন কৃষি ভর্তুকির সঙ্গে গুলিয়ে ফেলে, কখনো পুরোনো তথ্য দেয়।
Sarvam-Large ভারতীয় আইন ও নিয়মের জন্য আলাদাভাবে তৈরি তথ্যভিত্তিক কাঠামো ব্যবহার করে। যদি সে উত্তর না জানে, তবে মিথ্যা আশ্বাস না দিয়ে মানব কর্মীর কাছে বিষয়টি পাঠিয়ে দেয়। কারণ রাম সিংয়ের মতো একজন কৃষকের ক্ষেত্রে ভুল তথ্য মানে শুধু ভুল নয়—ফসল নষ্ট হওয়া।
ইংরেজি-প্রথম যুগের অবসান
ফিনটেক ব্যবস্থায় Sarvam-Large–এর সংযোজন মানে ভারতের ব্যাংকিংয়ে ইংরেজি-প্রথম যুগের শেষ। এতে ব্যাংকগুলো কম খরচে দেশের প্রান্তিক মানুষের কাছেও পরিষেবা পৌঁছে দিতে পারছে।
ব্যাংক পায় দক্ষতা।
রাম সিং পায় সম্মান।
সে আর নিজেকে অন্যের জন্য তৈরি একটি ব্যবস্থার সামনে অসহায় মনে করে না। প্রথমবারের মতো, সে এমন একজন গ্রাহক হয়ে উঠেছে—যাকে সত্যিই বোঝা হয়।
গভর্ন্যান্স ২.০ – এআই আমলা
দীর্ঘ কয়েক দশক ধরে ভারতের রাষ্ট্রযন্ত্রকে প্রায়ই একটি “অসংযত দৈত্য”-এর সঙ্গে তুলনা করা হয়েছে—আকারে বিশাল, ক্ষমতায় প্রবল, কিন্তু সূক্ষ্মভাবে কাজ করতে গিয়ে বারবার হোঁচট খাওয়া এক ব্যবস্থা। সমস্যার মূল কখনোই সদিচ্ছার অভাব ছিল না; ছিল সক্ষমতার সীমা। ১৪০ কোটির বেশি নাগরিক, অসংখ্য আইন-কানুন আর লাখ লাখ নথিপত্রের চাপে কল্যাণমূলক ব্যবস্থাই অনেক সময় বাধার দৌড়ে পরিণত হয়েছে।
এই প্রেক্ষাপটে আবির্ভাব ঘটেছে “এআই আমলা”-র। মানুষের মতো আমলাদের থেকে ভিন্নভাবে, সার্ভাম-লার্জ কখনো বিরতি নেয় না, একই প্রশ্নের উত্তর দিতে ক্লান্ত হয় না, আর সবচেয়ে গুরুত্বপূর্ণ—একটি ঘরে উপস্থিত সব ভাষাতেই কথা বলতে পারে।
নাগরিক-রাষ্ট্র সংযোগ: লাল ফিতার দৌরাত্ম্য থেকে লাল গালিচা
সার্ভাম-লার্জের সবচেয়ে রূপান্তরমূলক ব্যবহার দেখা গেছে নাগরিক-রাষ্ট্র সংযোগকে নতুনভাবে কল্পনা করার ক্ষেত্রে। আগে কোনো সরকারি প্রকল্পের সুবিধা পেতে হলে ইংরেজি বা দাপ্তরিক হিন্দিতে লেখা জটিল ফর্মের গোলকধাঁধায় ঢুকতে হতো, যার ফলে লক্ষ লক্ষ যোগ্য মানুষ কার্যত বাদ পড়ে যেতেন।
এই পরিবর্তনের সূচনা হয় “সিটিজেন কানেক্ট” উদ্যোগের মাধ্যমে—ওড়িশার মতো রাজ্য সরকারের সঙ্গে যৌথভাবে চালু হওয়া একটি পাইলট প্রকল্প। লক্ষ্য ছিল একটাই: সরকারকে কথোপকথনে পরিণত করা।
এখন আর সেবা কেন্দ্রে গিয়ে ফর্ম পূরণ করানোর জন্য দালালকে টাকা দিতে হয় না। একজন নাগরিক শুধু একটি টোল-ফ্রি নম্বরে ফোন করলেই হয়। ফোনের ওপারে কোনো যান্ত্রিক আইভিআর মেনু নয়, বরং সার্ভাম-লার্জ দ্বারা চালিত এক বুদ্ধিমান এজেন্ট কথা বলে।
একটি দৃশ্যপট: গ্রামীণ এলাকার এক বিধবা মহিলা ফোন করে জানতে চান, তাঁর পেনশন কেন আসেনি।
সংলাপ: তিনি সাম্বলপুরি উপভাষায় কথা বলেন। এআই শুধু শব্দই বোঝে না, তাঁর উদ্বেগও অনুভব করে। ব্যাকএন্ড ট্রেজারি ডেটাবেস দেখে ব্যাংক অ্যাকাউন্টের একটি ত্রুটি চিহ্নিত করে এবং তা কীভাবে ঠিক করতে হবে, সহজ ভাষায় বুঝিয়ে দেয়—সবই মুহূর্তের মধ্যে।
ফলাফল: আগে যেখানে তিনবার সরকারি দপ্তরে যেতে হতো, সেখানে এখন তিন মিনিটের ফোনকলেই সমস্যার সমাধান হয়। ভাষা ও সাক্ষরতার বাধা কার্যত বিলীন হয়ে যায়।
আরও বুদ্ধিমান আধার: অদৃশ্য ভিত্তি
কেন্দ্রীয় স্তরে, ভারতের ইউনিক আইডেন্টিফিকেশন অথরিটি (ইউআইডিএআই)-এর সঙ্গে সার্ভামের অংশীদারিত্ব ডিজিটাল পরিকাঠামোয় এক বড় অগ্রগতি। আধার পৃথিবীর সবচেয়ে বড় বায়োমেট্রিক পরিচয় ব্যবস্থা হলেও, এর সহায়ক পরিষেবাগুলি দীর্ঘদিন ধরেই অতিরিক্ত চাপের মধ্যে ছিল।
সার্ভাম-লার্জ আধার পরিষেবাকে আরও “স্মার্ট” করে তুলেছে। এটি নতুন প্রজন্মের অভিযোগ নিষ্পত্তি বটগুলিকে চালনা করছে, যা বায়োমেট্রিক আপডেট বা ঠিকানা পরিবর্তনের মতো জটিল প্রশ্নও সামলাতে পারে। আগের নিয়মভিত্তিক বটের মতো ব্যবহারকারীকে বারবার প্রশ্নোত্তর পাতায় ঘুরিয়ে না দিয়ে, এই ব্যবস্থা ব্যবহারকারীর নির্দিষ্ট সমস্যাটি বুঝে তার পরিস্থিতি অনুযায়ী সঠিক আইনি নির্দেশনা দেয়। এর ফলে আপডেট সংক্রান্ত আবেদন বাতিলের হার ৪০ শতাংশেরও বেশি কমেছে।
নীতিনির্ধারণের ইঞ্জিন: গণতন্ত্রের ভাষায় খসড়া
সবচেয়ে উচ্চাকাঙ্ক্ষী ব্যবহারটি সম্ভবত সচিবালয়ের অন্দরেই। ভারতে নীতি প্রণয়ন অত্যন্ত জটিল কাজ—আদালতের জন্য আইনকে ইংরেজিতে নিখুঁত হতে হয়, আবার সাধারণ মানুষের জন্য ২২টি সরকারি ভাষায় বোধগম্যও হতে হয়।
সার্ভাম-লার্জ এখানে বহুভাষিক নীতিনির্ধারণে আমলাদের সহায়তা করছে। কোনো স্বাস্থ্যনীতি যখন ইংরেজিতে খসড়া করা হয়, মডেলটি শুধু অনুবাদ করে না; এটি “রূপান্তর-সৃষ্টি” করে। অর্থাৎ, আইনি সূক্ষ্মতা বজায় রেখে তামিল, বাংলা বা মারাঠিতে এমনভাবে উপস্থাপন করে, যাতে তা যান্ত্রিক অনুবাদ বলে মনে না হয়।
এছাড়াও, জটিল আইনি নথিকে সহজ করার কাজে এটি ব্যবহৃত হচ্ছে। “সিম্পলিফাই” ফিচারের মাধ্যমে কোনো নাগরিক ঘন আইনিভাষায় লেখা সরকারি আদেশ আপলোড করলে, মডেলটি তার সারাংশ তৈরি করে দেয়—যেমন: “এই আদেশ অনুযায়ী আপনি সৌর পাম্পের জন্য ২০,০০০ টাকা ভর্তুকি পেতে পারেন, তবে ৩১ মার্চের আগে আবেদন করতে হবে।”
“মধ্যস্বত্বভোগী রাজ”-এর অবসান
গভর্ন্যান্স ২.০-এর প্রকৃত প্রভাব দেখা যাচ্ছে ধীরে ধীরে “মধ্যস্বত্বভোগী”-দের ভূমিকা কমে যাওয়ায়—যাঁরা জটিল রাষ্ট্রযন্ত্র আর সাধারণ নাগরিকের মাঝের ফাঁককে পুঁজি করে বছরের পর বছর লাভ করেছেন।
প্রতিটি নাগরিকের হাতে একটি এআই আমলা পৌঁছে দিয়ে, সার্ভাম রাষ্ট্রের সঙ্গে সংযোগকে গণতান্ত্রিক করে তুলছে। এতে এমন এক ভবিষ্যতের ইঙ্গিত মেলে, যেখানে সরকার দূরের, দুর্বোধ্য কোনো সত্তা নয়, বরং এমন এক সেবাদাতা প্রতিষ্ঠান—যে আপনার ভাষায় কথা বলে, আক্ষরিক অর্থেও এবং ভাবার্থেও।
বিশ্বাসের স্থাপত্য (The Architecture of Trust)
ডিজিটাল যুগে বিশ্বাস আর কেবল বিমূর্ত ধারণা নয়—এটি ভৌত বাস্তবতা। একটি সার্ভার কোথায় অবস্থিত, কোন দেশের আইন তার ওপর প্রযোজ্য, আর ডেটার চাবিকাঠি কার হাতে—এসব দিয়েই আজ বিশ্বাসের মানে নির্ধারিত হয়। বহু বছর ধরে ভারতের নানা প্রতিষ্ঠান এক ধরনের “ভাড়াভিত্তিক বিশ্বাস” ব্যবস্থার ওপর নির্ভর করেছে। চিকিৎসা নথি, আর্থিক ইতিহাস, আইনি দলিলের মতো সংবেদনশীল তথ্য বিদেশি কর্পোরেশনের মালিকানাধীন এপিআইয়ের মাধ্যমে প্রবাহিত হয়েছে। তথ্য এনক্রিপ্টেড থাকলেও শেষ পর্যন্ত সেগুলো যুক্তরাষ্ট্রের আইনি আওতা এবং সিলিকন ভ্যালির ভূরাজনৈতিক অনিশ্চয়তার অধীনেই ছিল।
এই দুর্বলতাকে ভেঙে দেওয়ার লক্ষ্যেই Sarvam-Large–এর নকশা তৈরি হয়েছে। এটি একটি “সার্বভৌম সেফটি স্ট্যাক” চালু করে, যা নিশ্চিত করে যে ভারতীয় তথ্য শুধু গোপনই নয়—ভৌত ও আইনি অর্থেও সম্পূর্ণ ভারতীয় থাকবে।
ডেটা রেসিডেন্সির দুর্গ: যে তথ্য কখনো দেশ ছাড়ে না
Sarvam-এর নিরাপত্তা স্থাপত্যের মূলভিত্তি হলো কঠোর ডেটা লোকালাইজেশন। যেখানে বৈশ্বিক মডেলগুলো উত্তর ভার্জিনিয়া বা ফ্রাঙ্কফুর্টের মতো বিদেশি ডেটা সেন্টারে প্রশ্ন প্রক্রিয়াকরণ করে, সেখানে Sarvam-Large পুরোপুরি ভারতের ভেতরেই হোস্ট করা।
ইনফ্রাস্ট্রাকচার: এই মডেলটি IndiaAI-এর সার্বভৌম কম্পিউট অবকাঠামোর ওপর চলে—উচ্চক্ষমতার GPU ক্লাস্টারের একটি নেটওয়ার্ক, যা Yotta ও CtrlS-এর মতো ভারতীয় ডেটা সেন্টারে স্থাপিত।
“এয়ার-গ্যাপড” নিশ্চয়তা: প্রতিরক্ষা ও ব্যাংকিংয়ের মতো সংবেদনশীল খাতে Sarvam “এয়ার-গ্যাপড” ডেপ্লয়মেন্ট দেয়। অর্থাৎ, এআইটি প্রতিষ্ঠানের নিজস্ব প্রাইভেট সার্ভারে চলে এবং পাবলিক ইন্টারনেটের সঙ্গে সম্পূর্ণ বিচ্ছিন্ন থাকে। কোনো ব্যাংক যদি ঋণঝুঁকি বিশ্লেষণে Sarvam-Large ব্যবহার করে, তবে গ্রাহকের এক বাইট তথ্যও Sarvam-এর সদর দপ্তরে বা বিদেশি সার্ভারে পাঠানো হয় না।
নৈতিক রক্ষাকবচ: পশ্চিম নয়, “ভারত”-কে কেন্দ্র করে সমাধান
এআই নিরাপত্তা সাধারণত পশ্চিমা মানদণ্ডে সংজ্ঞায়িত—যুক্তরাষ্ট্রকেন্দ্রিক সহিংসতা বা রাজনৈতিক বিভ্রান্তি ঠেকানোই সেখানে মূল লক্ষ্য। কিন্তু ভারতের নিজস্ব সামাজিক জটিলতা ও সংবেদনশীলতা রয়েছে, যা অনেক পশ্চিমা মডেল ধরতেই পারে না।
Sarvam-Large ব্যবহার করে একটি নিজস্ব “ইন্ডিক অ্যালাইনমেন্ট” ফ্রেমওয়ার্ক, যা ভারতের বহুমাত্রিক সামাজিক বাস্তবতাকে বিবেচনায় নেয়।
জাত ও ধর্ম সংবেদনশীলতা: অনেক পশ্চিমা মডেল জাতব্যবস্থার সূক্ষ্ম দিক বুঝতে ব্যর্থ হয়—কখনো জাতিবিদ্বেষী শব্দ তৈরি করে ফেলে, কখনো বৈষম্যমূলক প্রেক্ষাপট শনাক্ত করতে পারে না। Sarvam-এর দল হাজার হাজার প্রতিকূল প্রম্পট দিয়ে মডেলকে স্ট্রেস-টেস্ট করেছে, যাতে এটি ঘৃণামূলক বক্তব্য বা সাম্প্রদায়িক উত্তেজনা সৃষ্টিকারী বর্ণনা দিতে অস্বীকার করে।
“লিগ্যাল সেফটি স্কোর”: IIT Madras-এর মতো গবেষণা সহযোগীদের সঙ্গে কাজ করে Sarvam একটি লিগ্যাল সেফটি স্কোর ব্যবহার করে। এর মাধ্যমে নিশ্চিত করা হয় যে ভারতীয় আইন নিয়ে আলোচনা করলে মডেলটি সংবিধানের কাঠামোর মধ্যেই থাকে। ফলে “আমদানি করা নৈতিকতা” চাপিয়ে দেওয়া হয় না—যেমন, ভারতীয় মেধাস্বত্বের প্রশ্নে আমেরিকান কপিরাইট আইন প্রয়োগ করা হয় না, কিংবা যুক্তরাষ্ট্রের প্রথম সংশোধনীর অধিকারকে ভারতের অনুচ্ছেদ ১৯-এর সঙ্গে গুলিয়ে ফেলা হয় না।
পক্ষপাতের বাইরে: প্রতিনিধিত্বই নিরাপত্তা
আসল নিরাপত্তা মানে ন্যায্য প্রতিনিধিত্বও। যে মডেল হিন্দিতে ভালো কাজ করে কিন্তু তামিলে ব্যর্থ হয়, সেটি স্বভাবতই পক্ষপাতদুষ্ট। Sarvam-এর “বিশ্বাসের স্থাপত্য”-এ রয়েছে একটি ভাষাগত ন্যায্যতা প্রোটোকল।
প্রশিক্ষণের সময় ডেটাসেট এমনভাবে ভারসাম্যপূর্ণ করা হয়েছে, যাতে ওড়িয়া বা অসমিয়ার মতো “লো-রিসোর্স” ভাষা হিন্দির মতো “হাই-রিসোর্স” ভাষার ভিড়ে হারিয়ে না যায়। এতে এআইয়ের সেই “মেজরিটারিয়ান বায়াস” কমে, যেখানে প্রভাবশালী ভাষার সাংস্কৃতিক মানদণ্ডই ডিফল্ট হয়ে ওঠে।
সীমান্তের বাইরে — গ্লোবাল সাউথের রোডম্যাপ
একটি কথা বহুদিন ধরেই উন্নয়ন অর্থনীতিতে ঘুরে বেড়ায়— যদি আপনি ভারতের সমস্যার সমাধান করতে পারেন, তবে আপনি গোটা বিশ্বের সমস্যার সমাধান করতে পারবেন।
কৃত্রিম বুদ্ধিমত্তার যুগে এই কথাটি আর শুধু দর্শন নয়; এটি এখন বাস্তব ও প্রযুক্তিগত সত্য।
ভারতকে প্রায়ই একটি দেশের চেয়ে একটি মহাদেশ বলা হয়। এখানে ২২টি সরকারি ভাষা, হাজার হাজার উপভাষা, আর এমন এক সামাজিক-অর্থনৈতিক বৈচিত্র্য আছে যেখানে একদিকে সিলিকন ভ্যালির মতো আধুনিকতা, অন্যদিকে প্রান্তিক কৃষিজীবন পাশাপাশি টিকে আছে।
এই জটিল, সীমিত সম্পদের পরিবেশে টিকে থাকা এবং সফল হওয়ার মতো একটি এআই মডেল তৈরি করে Sarvam AI আসলে অজান্তেই গোটা বিশ্বের জন্য একটি নকশা বানিয়ে ফেলেছে। Sarvam-Large এখন আর শুধু ভারতের সাফল্যের গল্প নয়; এটি হয়ে উঠেছে “গ্লোবাল সাউথ”-এর জন্য একটি কার্যকর প্রোটোটাইপ।
ডিজিটাল নন-অ্যালাইন্ড মুভমেন্ট
আফ্রিকা, দক্ষিণ-পূর্ব এশিয়া এবং লাতিন আমেরিকার অনেক দেশের সামনে জেনারেটিভ এআই একটি পরিচিত দ্বিধা তৈরি করেছিল।
একদিকে ছিল যুক্তরাষ্ট্রের ব্যয়বহুল, বন্ধ মডেলগুলো, অন্যদিকে চীনের রাষ্ট্রনিয়ন্ত্রিত প্রযুক্তি ব্যবস্থা। দুই ক্ষেত্রেই একটি বড় ঝুঁকি ছিল—ডেটার সার্বভৌমত্ব হারানো।
Sarvam AI এই দুইয়ের বাইরে একটি তৃতীয় পথ দেখিয়েছে। তারা প্রমাণ করেছে যে মৌলিক কৃত্রিম বুদ্ধিমত্তা গড়তে ট্রিলিয়ন-ডলারের অর্থনীতি বা বিশাল শক্তি অবকাঠামো অপরিহার্য নয়। সঠিক ইঞ্জিনিয়ারিং, মানসম্মত ডেটা এবং দক্ষ নকশার মাধ্যমে “সার্বভৌম এআই” তৈরি করা সম্ভব।
এই ভাবনাই জন্ম দিয়েছে যাকে বিশ্লেষকেরা বলছেন “ডিজিটাল নন-অ্যালাইন্ড মুভমেন্ট”। ইন্দোনেশিয়া, নাইজেরিয়া কিংবা ব্রাজিলের মতো দেশগুলো Sarvam-এর মডেল কিনতে নয়, বরং তার পদ্ধতি অনুকরণ করতে আগ্রহী।
নকশা: পদ্ধতির রপ্তানি
Sarvam গ্লোবাল সাউথকে কোনো পণ্য নয়, একটি পদ্ধতি উপহার দিচ্ছে। Sarvam-Large-এর মূল ভিত্তিগুলো উন্নয়নশীল দেশগুলোর বাস্তব সমস্যার সঙ্গেই মিলে যায়।
১. টোকেনাইজার টেমপ্লেট
হিন্দি ও তামিলের জন্য Sarvam যেমন “টোকেনাইজার ট্যাক্স” কমিয়েছে, তেমনি আফ্রিকার গবেষকেরা এখন সোয়াহিলি ও আমহারিক ভাষার জন্য একই কৌশল প্রয়োগ করছেন। তারা বুঝতে পারছেন—নিজেদের ভাষা ব্যবহারের জন্য আর পশ্চিমা মডেলের অতিরিক্ত মূল্য দিতে হবে না; প্রয়োজনে ভাষার ভিত্তিটাই নতুন করে গড়া যায়।
২. সাশ্রয়ী কম্পিউটিং
গ্লোবাল সাউথের পক্ষে শক্তিখরচা, বিশাল ডেটা সেন্টার চালানো সম্ভব নয়। Sarvam দেখিয়েছে যে তুলনামূলক ছোট কিন্তু দক্ষ মডেল (৭ থেকে ১০ বিলিয়ন প্যারামিটার) সাধারণ হার্ডওয়্যারেও কার্যকর হতে পারে। অর্থাৎ, কার্যকর বুদ্ধিমত্তার জন্য বিশাল আকার অপরিহার্য নয়।
৩. কণ্ঠভিত্তিক নকশা
ভারতের মতো গ্লোবাল সাউথের অনেক দেশেই মৌখিক সংস্কৃতি শক্তিশালী। সাক্ষরতার হার ভিন্ন হলেও মোবাইল ফোন প্রায় সবার হাতে। Sarvam-এর “ভয়েস-নেটিভ” ধারণা—লেখার আগে কণ্ঠকে গুরুত্ব দেওয়া—গ্রামীণ কেনিয়া বা আন্দিজ অঞ্চলের মতো জায়গায় ডিজিটাল অন্তর্ভুক্তির চাবিকাঠি হয়ে উঠতে পারে।
পরবর্তী ধাপ: চ্যাটবট থেকে এজেন্ট
এই গল্পের শেষ পাতায় দাঁড়িয়ে আমরা সামনে তাকাই। Sarvam-Large-এর সাফল্যে থেমে নেই Sarvam-এর দল। বেঙ্গালুরুর ল্যাবগুলোতে ইতিমধ্যেই পরবর্তী প্রজন্মের মডেল Sarvam-Omni (Agentic) নিয়ে কাজ চলছে।
ভবিষ্যৎ শুধু কথা বলা চ্যাটবটের নয়; ভবিষ্যৎ কাজ করা এজেন্টের।
এই নতুন মডেলগুলো শুধু প্রশ্নের উত্তর দেবে না, কাজও করবে। কল্পনা করুন—একটি সাধারণ ফোনে থাকা “Sarvam এজেন্ট” কোনো কৃষককে শুধু পেঁয়াজের বাজারদর বলবে না; বরং সে নিজে ক্রেতার সঙ্গে দরদাম করবে, ট্রাকের সময় ঠিক করবে এবং কণ্ঠের নির্দেশেই ইউপিআই পেমেন্ট সম্পন্ন করবে।
তথ্যভিত্তিক এআই থেকে কার্যকর এআই-এ এই রূপান্তরই শেষ সীমান্ত। এতে স্মার্টফোন শুধু তথ্যের জানালা নয়, অর্থনীতির রিমোট কন্ট্রোল হয়ে উঠবে।
উপসংহার: বুদ্ধিমত্তার গণতন্ত্র
Sarvam AI-এর গল্প আসলে ভবিষ্যৎকে ফিরে পাওয়ার গল্প। দীর্ঘদিন প্রযুক্তির ভাষা পশ্চিমে লেখা হয়েছে, আর বাকিরা তা অনুবাদ করে ব্যবহার করেছে। Sarvam সেই ধারা বদলে দিয়েছে। তারা দেখিয়েছে—সবচেয়ে উন্নত প্রযুক্তিও নিজের সংস্কৃতি ও বাস্তবতার মাটিতে দাঁড়িয়ে তৈরি করা যায়।
আমরা যখন এই নতুন যুগের দোরগোড়ায় দাঁড়িয়ে, তখন “সার্বভৌমত্বের ব্যবধান” ধীরে ধীরে কমছে। ভবিষ্যতের এআই একক ভাষায়, এক দেশ থেকে বলা কোনো মনোলগ হবে না। এটি হবে বহু ভাষা, বহু সংস্কৃতির সম্মিলিত কণ্ঠ—সমানভাবে কথা বলা এক বৈশ্বিক সুর।
ভারত তার কণ্ঠ খুঁজে পেয়েছে।
আর সেই কণ্ঠই বিশ্বকে কথা বলার সাহস জুগিয়েছে।
SarvamAI #SovereignAI #SarvamLarge #IndiaAI #GenerativeAI #MakeInIndia #DigitalSovereignty #IndicLLM #AIRevolution #TechInnovation #GPT4Alternative #VoiceAI #CodeSwitching #FintechAI #GovTech #AIforBharat #MultilingualAI #DeepTech #GlobalSouth #IndianStartup