স্বদেশি বুদ্ধিমত্তার সূচনা

বেঙ্গালুরুতে এক ঐতিহাসিক মাইলফলক

২০২৫ সালের ১২ জুন, ভারতের প্রযুক্তি রাজধানী বেঙ্গালুরু দেশটির ডিজিটাল ইতিহাসে এক গুরুত্বপূর্ণ মোড়ের সাক্ষী হয়। প্রবল প্রত্যাশার আবহে, ভাবিশ আগরওয়ালের প্রতিষ্ঠিত কৃত্রিম বুদ্ধিমত্তা সংস্থা Krutrim উন্মোচন করে তাদের নতুন প্ল্যাটফর্ম “Kruti”—যা মানুষ ও যন্ত্রের সম্পর্ককে নতুনভাবে সংজ্ঞায়িত করার প্রতিশ্রুতি দেয়। এই মুহূর্তটি কেবল একটি পণ্য উন্মোচনের অনুষ্ঠান ছিল না; এটি ছিল প্রযুক্তিগত সার্বভৌমত্বের এক সুস্পষ্ট ঘোষণা। এতদিন ভারতীয় বাজার মূলত পাশ্চাত্যের এআই মডেলের ভোক্তা ছিল—এই ঘোষণার মাধ্যমে ভারত নিজেকে নির্মাতা হিসেবে প্রতিষ্ঠা করার দাবি জানায়।

মঞ্চে উঠে ভাবিশ আগরওয়াল Kruti-কে কোনো সাধারণ চ্যাটবট হিসেবে নয়, বরং ভারতের প্রথম “লোকালাইজড এজেন্টিক এআই” হিসেবে পরিচয় করিয়ে দেন। এই পার্থক্যটি ছিল তাৎক্ষণিক ও অত্যন্ত গুরুত্বপূর্ণ। আগের প্রজন্মের এআই কবিতা লিখতে বা ইমেল সংক্ষেপ করতে পারলেও, Kruti-কে তৈরি করা হয়েছে কাজ করার জন্য। ডেমোনস্ট্রেশনে দেখানো হয়—ভারতীয় লজিস্টিকসের জটিল বাস্তবতায় এটি কীভাবে অনায়াসে পথ খুঁজে নিতে পারে: ক্যাব বুকিং, খাবার অর্ডার, বিল পরিশোধ—সবকিছু একটিমাত্র কণ্ঠ-নির্দেশে সমন্বিতভাবে সম্পন্ন করা যায়।

ভাবিশ আগরওয়ালের দৃষ্টি: সার্বভৌম এআই

উদ্বোধনের কেন্দ্রে ছিল আগরওয়ালের “সার্বভৌম এআই”-এর ভাবনা। তাঁর যুক্তি ছিল—২০৪৭ সালের মধ্যে ভারতকে উন্নত রাষ্ট্রে পরিণত করতে হলে, ক্যালিফোর্নিয়ার ডেটা সেন্টারে প্রশিক্ষিত এবং উপমহাদেশের সাংস্কৃতিক প্রেক্ষাপটের বাইরে থাকা ফাউন্ডেশনাল মডেলের ওপর নির্ভর করা চলবে না।

তিনি বলেন,
Kruti এমন এক ভবিষ্যতের দিকে প্রথম বাস্তব পদক্ষেপ, যেখানে এআই শুধু কথোপকথনেই সীমাবদ্ধ নয়—এটি সত্যিই কাজ করে দেয়।”

এই দৃষ্টিভঙ্গিতে Kruti-কে কেবল একটি পণ্য নয়, বরং একটি ডিজিটাল পাবলিক গুড হিসেবে কল্পনা করা হয়েছে—যেমন রাস্তা বা ইউপিআই (Unified Payments Interface) দেশের অবকাঠামোর অংশ। লক্ষ্য ছিল এমন একটি এআই তৈরি করা, যা হবে বহুভাষিক, মোবাইল-প্রথম এবং স্বজ্ঞাত—বিশেষভাবে এমন জনসংখ্যার জন্য, যেখানে ইংরেজি প্রায়ই দ্বিতীয় বা তৃতীয় ভাষা, আর ডিজিটাল সাক্ষরতার স্তরও ব্যাপকভাবে ভিন্ন।

তাৎপর্য: চ্যাটবটের গণ্ডির বাইরে

Kruti-র উন্মোচন ছিল সিলিকন ভ্যালির তথাকথিত “LLM যুদ্ধ” থেকে একটি স্পষ্ট সরে আসা। যেখানে বৈশ্বিক প্রযুক্তি জায়ান্টরা বেশি প্যারামিটার আর একাডেমিক সূচকের পেছনে ছুটছে, সেখানে Krutrim গুরুত্ব দিয়েছে বাস্তব ব্যবহারযোগ্যতা ও সমন্বয়ের ওপর।

এই মুহূর্তটির তাৎপর্য দাঁড়িয়ে আছে তিনটি মূল স্তম্ভের ওপর—

১. ভাষাগত অন্তর্ভুক্তি:
১৩টি ভারতীয় ভাষায় সমর্থন নিয়ে যাত্রা শুরু করে Kruti প্রযুক্তির সুফলকে ঘিরে থাকা ভাষার দেয়াল ভেঙে দেয়। এটি স্বীকার করে যে, কলকাতার একজন বাংলা ভাষাভাষী ও চেন্নাইয়ের একজন তামিল ভাষাভাষী কেবল শব্দচয়নে নয়, ব্যবহারিক উদ্দেশ্যেও প্রযুক্তিকে ভিন্নভাবে গ্রহণ করেন।

২. এজেন্টিক রূপান্তর:
“জেনারেটিভ” থেকে “এজেন্টিক”-এ এই উত্তরণ প্রযুক্তির পরিপক্বতার ইঙ্গিত। Kruti-কে এমনভাবে নকশা করা হয়েছে যাতে এটি অন্যান্য অ্যাপ (যেমন Zomato বা Ola)-এর সঙ্গে সরাসরি কাজ করতে পারে—ব্যবহারকারীর মৌখিক চাহিদা (“আমাকে বাড়ি ফিরতে হবে আর খেতে হবে”) আর ডিজিটাল অর্থনীতির কঠোর এপিআই-এর মধ্যে এক ধরনের সার্বজনিক অনুবাদক হিসেবে কাজ করে।

৩. ডেটা স্বনির্ভরতা:
ভারতীয় ডেটাসেটে মডেল তৈরি ও দেশের অভ্যন্তরীণ ক্লাউড অবকাঠামোয় হোস্টিংয়ের মাধ্যমে Krutrim ডেটা উপনিবেশবাদ ও গোপনীয়তা সংক্রান্ত উদ্বেগের জবাব দেয়—নিশ্চিত করে যে ভারতীয় নাগরিকদের ডিজিটাল তথ্য দেশের সীমানার মধ্যেই থাকে।

অনুষ্ঠান শেষ হওয়ার পর শিল্পমহলের অভিমত ছিল একবাক্যে স্পষ্ট—Kruti-র উদ্বোধন কেবল একটি নতুন অ্যাপের আত্মপ্রকাশ নয়। এটি হতে পারে “এআই-এর জন্য ইউপিআই মুহূর্ত”—একটি যুগান্তকারী উদ্ভাবন, যা কৃত্রিম বুদ্ধিমত্তাকে অভিজাতদের গণ্ডি থেকে বের করে এনে সাধারণ মানুষের কণ্ঠে তুলে দিতে সক্ষম।

এজেন্টিক এআই’-এর সংজ্ঞা: চ্যাটবটের সীমা পেরিয়ে

চ্যাটবটের স্থবিরতা

গত কয়েক বছরে বিশ্ব জেনারেটিভ এআই-এর মুগ্ধতায় ডুবে গেছে। শেক্সপিয়ারের ভঙ্গিতে সনেট লেখা, কয়েক সেকেন্ডে জটিল কোড ডিবাগ করা, কিংবা হাজার পৃষ্ঠার নথি সংক্ষেপ করা—এসব ক্ষমতা আমাদের বিস্মিত করেছে। কিন্তু এই সব কৃতিত্বের আড়ালেও লার্জ ল্যাঙ্গুয়েজ মডেলগুলোর (LLM) একটি মৌলিক সীমাবদ্ধতা রয়েছে: তারা কাঁচের পর্দার ওপারে বন্দি। তারা আপনাকে টায়ার বদলানোর উপায় বলতে পারে, কিন্তু মেকানিককে ফোন করতে পারে না। তারা রাতের খাবারের মেনু সাজেস্ট করতে পারে, কিন্তু বাজার করে আনতে পারে না।

এটাই হলো “জেনারেটিভ গ্যাপ”। প্রচলিত LLM আসলে তথ্যের নিষ্ক্রিয় প্রক্রিয়াকর—তারা চিন্তা করে ও কথা বলে, কিন্তু তাদের কোনো “হাত” নেই।

পরিবর্তন: জেনারেশন থেকে এজেন্সির দিকে

“এজেন্টিক এআই”—যে শ্রেণিতে Krutrim-এর Kruti অন্তর্ভুক্ত—এই ফাঁক পূরণের জন্য প্রয়োজনীয় বিবর্তনমূলক লাফের প্রতিনিধিত্ব করে। যদি জেনারেটিভ এআই হয় “মস্তিষ্ক”, তবে এজেন্টিক এআই সেই মস্তিষ্কে যোগ করে “হাত”।

প্রযুক্তিগত পার্থক্যটি নিহিত রয়েছে নকশাগত উদ্দেশ্যে। একটি সাধারণ LLM বাক্যে পরবর্তী সম্ভাব্য শব্দটি অনুমান করে। কিন্তু একটি এজেন্টিক মডেল অনুমান করে—সমস্যা সমাধানের জন্য পরবর্তী কোন কর্মটি প্রয়োজন। ফলে এটি Input → Response চক্র থেকে সরে এসে Goal → Plan → Action → Execution চক্রে প্রবেশ করে।

ব্যবহারকারী যখন Kruti-এর মতো কোনো এজেন্টিক এআই-এর সঙ্গে কথা বলেন, তখন সিস্টেমটি কেবল ব্যাকরণ বিশ্লেষণ করে না; এটি উদ্দেশ্য বিশ্লেষণ করে, যাতে প্রয়োজনীয় বাহ্যিক টুল সক্রিয় করা যায়। এটি এক ধরনের সমন্বয় স্তর হিসেবে কাজ করে—যেখানে অন্যান্য সফটওয়্যার, API এবং ডিজিটাল ইকোসিস্টেমের সঙ্গে সরাসরি সংযোগ সম্ভব। এজেন্টিক এআই শুধু “জানে” না, সে “করে”।

“ডুয়ার লুপ”: এটি কীভাবে কাজ করে

এই পার্থক্যের গুরুত্ব বোঝার জন্য কাজের ধারা দেখাই যথেষ্ট। একটি সাধারণ চ্যাটবটে আপনি যদি বলেন, “আমার জন্য এয়ারপোর্টে যাওয়ার গাড়ি বুক করো,”—তাহলে সেটি সাধারণত দুঃখ প্রকাশ করে জানায় যে বাস্তব জগতের কাজ সে করতে পারে না।

কিন্তু একটি এজেন্টিক ওয়ার্কফ্লো তখন নীরবে একটি জটিল সিদ্ধান্ত-শৃঙ্খলে প্রবেশ করে—

  • অনুধাবন (Perception): এটি বোঝে যে ব্যবহারকারী একটি যাত্রার ব্যবস্থা চান (উদ্দেশ্য)।
  • টুল নির্বাচন (Tool Selection): এটি শনাক্ত করে যে রাইড-হেইলিং অ্যাপগুলোর অ্যাক্সেস তার আছে (সক্ষমতা)।
  • প্যারামিটার সংগ্রহ (Parameter Extraction): প্রয়োজনীয় তথ্য—অবস্থান, গন্তব্য, গাড়ির ধরন—জিজ্ঞেস করে বা সংগ্রহ করে (প্রেক্ষিত)।
  • কার্যকর করা (Execution): রাইড-হেইলিং সার্ভিসের API-তে কোডেড অনুরোধ পাঠায় (কর্ম)।
  • নিশ্চিতকরণ (Confirmation): ড্রাইভারের বিবরণ পেয়ে তা ব্যবহারকারীকে জানায় (ফিডব্যাক)।

বাস্তব জগতের সঙ্গে এই সরাসরি যোগাযোগের ক্ষমতাই এআই-কে কৌতূহলের বিষয় থেকে সত্যিকারের উপযোগী টুলে রূপান্তর করে।

কেন এটিই পরবর্তী ঢেউ

এজেন্টিক এআই-এর দিকে অগ্রসর হওয়া কেবল একটি নতুন ফিচার যোগ করা নয়; এটি মানব–কম্পিউটার যোগাযোগে (HCI) এক মৌলিক দৃষ্টিভঙ্গির পরিবর্তন। এটি প্রতিশ্রুতি দেয় “ইন্টারফেসের পতন”

আজ আমাদের ডিজিটাল জীবন ছড়িয়ে আছে অসংখ্য অ্যাপে—খাবারের জন্য এক অ্যাপ, যাতায়াতের জন্য আরেকটি, পেমেন্টের জন্য তৃতীয়টি। এই সব সেবাকে জোড়া লাগানোর “আঠা” হিসেবে কাজ করি আমরা নিজেরাই—হোয়াটসঅ্যাপ থেকে ঠিকানা কপি করে উবারে পেস্ট করি, সিনেমার টিকিট কাটার আগে ক্যালেন্ডার দেখি।

এজেন্টিক এআই এই একঘেয়ে মধ্যস্থতাকারীর ভূমিকা থেকে মানুষকে মুক্ত করতে চায়। Kruti-এর মতো এজেন্টের হাতে কাজটি ছেড়ে দিলে, ব্যবহারকারী অ্যাপের মাইক্রোম্যানেজার না হয়ে ফলাফলের পরিচালক হয়ে ওঠেন। ভারতীয় প্রেক্ষাপটে এই পরিবর্তন বিশেষভাবে গুরুত্বপূর্ণ, কারণ এখানে ডিজিটাল সাক্ষরতার স্তর ভিন্ন ভিন্ন। জটিল গ্রাফিক্যাল ইন্টারফেস অনেকের জন্য বাধা হতে পারে; কিন্তু “আমার বিদ্যুৎ বিলটা দিয়ে দাও”—এমন একটি কণ্ঠ-নির্দেশ সবার জন্যই সহজ।

সংক্ষেপে বললে, জেনারেটিভ এআই কম্পিউটারকে কণ্ঠ দিয়েছে, আর এজেন্টিক এআই তাদের দিয়েছে এজেন্সি। এটি একটি বুদ্ধিমান বিশ্বকোষ আর একটি দক্ষ ব্যক্তিগত সহকারীর মধ্যকার পার্থক্য।

ভাষাগত সার্বভৌমত্ব: ভারতের বহুস্বর আয়ত্ত করার যাত্রা

বাবেল টাওয়ারের চ্যালেঞ্জ

ভারত শুধু একটি দেশ নয়; এটি এক একটি ভাষাগত মহাদেশ। ২২টি সাংবিধানিকভাবে স্বীকৃত ভাষা এবং শত শত উপভাষা—যেগুলো কয়েকশ কিলোমিটার পরপরই বদলে যায়—এই বৈচিত্র্যের মধ্যে একটি অভিন্ন ডিজিটাল ইন্টারফেস গড়ে তোলা বিশ্বের অন্যতম জটিল প্রকৌশল চ্যালেঞ্জ। দশকের পর দশক ধরে ডিজিটাল বিপ্লবের “ডিফল্ট” ভাষা হিসেবে ইংরেজিই আধিপত্য করেছে। এর ফলে তৈরি হয়েছে এক ধরনের ডিজিটাল জাতব্যবস্থা—একটি ছোট, সুবিধাভোগী গোষ্ঠী বৈশ্বিক ইন্টারনেটে সাবলীলভাবে চলাচল করতে পারে, আর বিপুল সংখ্যক মানুষ কার্যত উচ্চপ্রযুক্তিনির্ভর অর্থনীতি থেকে বাদ পড়ে থাকে।

১৩টি ভারতীয় ভাষার সমর্থন নিয়ে Kruti-র যাত্রা শুরু—যার মধ্যে রয়েছে হিন্দি, বাংলা, তামিল, তেলুগু, মালয়ালম, কন্নড়, মারাঠি, গুজরাটি ও পাঞ্জাবি—এই বাধা ভাঙারই একটি সচেতন প্রয়াস। এটি “ব্যবহারকারীকে প্রযুক্তির সঙ্গে মানিয়ে নেওয়া” থেকে সরে এসে “প্রযুক্তিকে ব্যবহারকারীর সঙ্গে মানিয়ে নেওয়ার” দৃষ্টিভঙ্গির দিকে অগ্রসর হওয়ার ইঙ্গিত দেয়।

অনুবাদের বাইরে: মাতৃভাষার সূক্ষ্ম বোঝাপড়া

ভারতের প্রেক্ষাপটে কোনো এআই মডেলের আসল পরীক্ষা অনুবাদে নয়, বরং ট্রান্সক্রিয়েশনে—অর্থাৎ শব্দের আড়ালে থাকা উদ্দেশ্য ও সংস্কৃতিকে বোঝার ক্ষমতায়। আক্ষরিক অনুবাদ প্রায়ই ভারতীয় কথ্য ভাষার উষ্ণতা, শ্রদ্ধা বা তাড়নাকে ধরতে ব্যর্থ হয়।

উদাহরণ হিসেবে বাংলা ভাষাকেই ধরা যাক—এখানে সম্বোধনের আলাদা স্তর রয়েছে: তুই (অন্তরঙ্গ), তুমি (পরিচিত), আপনি (সম্মানসূচক)। পাশ্চাত্য মডেলগুলো, যেগুলো মূলত ইংরেজি ডেটায় প্রশিক্ষিত—যেখানে “you” একটাই—এই সূক্ষ্ম পার্থক্যগুলোকে প্রায়শই একাকার করে ফেলে। ফলস্বরূপ উত্তরগুলো শোনায় যান্ত্রিক, কখনো কখনো অশোভনও। Krutrim মডেলের ভিত্তিতে তৈরি Kruti এই সামাজিক স্তরবিন্যাস বুঝে নিতে সক্ষম। সে জানে—ব্যবসায়িক ঋণ সম্পর্কে প্রশ্নের সুর একরকম হবে, আর সিনেমার টিকিট নিয়ে প্রশ্নের সুর হবে আরেকরকম।

উপভাষার জটিলতা

পাঠ্যবইয়ের ভাষা ছেড়ে যখন আমরা বাস্তব জীবনের উপভাষায় পা রাখি, তখন জটিলতা আরও বাড়ে। গুরুগ্রামের কর্পোরেট করিডরে ব্যবহৃত হিন্দি, পূর্ব উত্তরপ্রদেশের ভোজপুরি-প্রভাবিত হিন্দি কিংবা হায়দরাবাদের দাক্ষিণি উর্দু-হিন্দি মিশ্রণ—সবকটিই একে অপরের থেকে ভিন্ন।

Kruti-র স্থাপত্য এই “কোড-সুইচিং” বাস্তবতাকে স্বীকৃতি দেয়—একই বাক্যে একাধিক ভাষা মেশানোর স্বভাব, যা ভারতে খুবই স্বাভাবিক (হিংলিশ, ট্যাংলিশ, বাংলিশ)। মিশ্র-লিপির ডেটায় প্রশিক্ষণের ফলে, এটি অনায়াসে এমন নির্দেশ বুঝতে পারে—
Market jaane ke liye ek auto book koro
এখানে হিন্দি বাক্যগঠন, ইংরেজি বিশেষ্য এবং বাংলা ক্রিয়ার মিশ্রণকে সে নির্বিঘ্নে বিশ্লেষণ করতে পারে—যা শহুরে ভারতের দৈনন্দিন ভাষারই প্রতিফলন।

স্থানীয় ডেটাসেটের গুরুত্ব

এই মাত্রার ভাষাগত সাবলীলতা কখনোই সম্ভব নয়, যদি মডেলটি শুধুমাত্র পাশ্চাত্য ইন্টারনেটের “কমন ক্রল” ডেটায় প্রশিক্ষিত হয়। ইন্টারনেটে ইংরেজির আধিক্যের কারণে, GPT-4 বা Claude-এর মতো শক্তিশালী মডেলগুলোও কম-সম্পদযুক্ত ভারতীয় ভাষায় প্রায়ই বিভ্রান্ত হয় বা প্রত্যাশার নিচে ফল দেয়।

এখানেই Krutrim-এর “ভাষাগত সার্বভৌমত্ব” ধারণা গুরুত্বপূর্ণ হয়ে ওঠে—অর্থাৎ, যে ডেটার ওপর ভারতের এআই গড়ে উঠবে, তার মালিকানা ভারতকেই রাখতে হবে। এর জন্য নেওয়া হয়েছে এক বিশাল উদ্যোগ—

  • মৌখিক ইতিহাসের ডিজিটাইজেশন: বিভিন্ন অঞ্চলের কণ্ঠস্বর সংগ্রহ করে উচ্চারণ ও টানের পার্থক্য বোঝা।
  • আঞ্চলিক সাহিত্য: স্থানীয় সংবাদপত্র, সাহিত্য ও আইনি নথিতে প্রশিক্ষণ দিয়ে ব্যাকরণগত নির্ভুলতা নিশ্চিত করা।
  • সাংস্কৃতিক প্রেক্ষাপট: ভারতীয় বাস্তবতাকে প্রতিফলিত করে এমন ডেটা অন্তর্ভুক্ত করা—যেমন “চা” যে শুধু একটি পানীয় নয়, বরং দৈনন্দিন জীবনের অনুষঙ্গ; কিংবা “বর্ষা” মানেই যানজট আর নির্দিষ্ট কিছু খাবারের আকাঙ্ক্ষা।

এই স্বত্বাধিকারভিত্তিক ডেটাসেটের মাধ্যমে Krutrim নিশ্চিত করে যে মডেলের “বুদ্ধিমত্তা” ভারতীয় বাস্তবতার মাটিতে প্রোথিত—কোনো আমেরিকান দৃষ্টিভঙ্গির অনুবাদ-আবরণ নয়।

ডিজিটাল অর্থনীতির গণতন্ত্রীকরণ

শেষ পর্যন্ত, এই ১৩টি ভাষায় দক্ষতা অর্জন একটি অর্থনৈতিক অনুঘটক। এর অর্থ—মহারাষ্ট্রের একজন কৃষক মধ্যস্থতাকারী ছাড়াই মারাঠিতে ফসলের দাম জানতে পারেন। কলকাতার এক দিদিমা বাংলায় কণ্ঠ-নির্দেশ দিয়ে নাতি-নাতনির সঙ্গে ভিডিও কল করতে পারেন।

ভাষাগত সার্বভৌমত্ব কেবল জাতীয় গৌরবের বিষয় নয়; এটি ব্যবহারিক প্রয়োজনের প্রশ্ন। ইংরেজির বাধ্যবাধকতা সরিয়ে দিয়ে Kruti পরবর্তী এক বিলিয়ন ব্যবহারকারীকে অনলাইনে আনতে চায়—শুধু ভিডিও দেখার নিষ্ক্রিয় ভোক্তা হিসেবে নয়, বরং নিজেদের মাতৃভাষায় ব্যাংকিং, বুকিং এবং নির্মাণে সক্রিয় অংশগ্রহণকারী হিসেবে।

কথোপকথন থেকে বাস্তবায়ন: ‘ডুয়ার’ অর্থনীতির উত্থান

বৃহৎ বিচ্ছিন্নতা: ডিজিটাল অভিপ্রায় বনাম বাস্তব কর্ম

গত প্রায় এক দশক ধরে প্রযুক্তির সঙ্গে আমাদের সম্পর্ককে চিহ্নিত করছে একটাই অনুভূতি—“অ্যাপ ক্লান্তি”। অভাবনীয় সুবিধার যুগে বাস করলেও, সেই সুবিধা পেতে গিয়ে আমাদের পেরোতে হয় আশ্চর্য রকমের ঘর্ষণ। রাতের খাবার অর্ডার করতে হলে ফোন আনলক করা, ফুড ডেলিভারি অ্যাপ খোঁজা, মেনু স্ক্রল করা, আইটেম বাছা, কার্টে যাওয়া, তারপর পেমেন্ট অথেনটিকেশন। কোথাও যেতে চাইলে আবার অ্যাপ বদল, লোকেশন পিন, গাড়ি নির্বাচন।

আমাদের ডিজিটাল ইচ্ছা—“আমার খিদে পেয়েছে”—আর বাস্তব ফলাফল—দরজায় খাবার পৌঁছানো—এই দুয়ের মাঝখানে তৈরি হয়েছে ট্যাপ, সোয়াইপ আর লোডিং স্ক্রিনের বিশাল ফাঁক। আগের প্রজন্মের এআই এখানেই ব্যর্থ হয়েছিল; সে পিজার ইতিহাস বলতে পারত, কিন্তু পিজা অর্ডার করতে পারত না।

‘ডুয়ার’ অর্থনীতির আবির্ভাব

Kruti আমাদের নিয়ে যায় “ডুয়ার ইকোনমি”-র যুগে—এমন এক কম্পিউটিং পর্যায়, যেখানে সাফল্যের মাপকাঠি আর এনগেজমেন্ট টাইম নয়, বরং কাজ সম্পন্ন হওয়া। Kruti-র দর্শন খুবই সরল: ইন্টারফেসই আসল বাধা। গ্রাফিক্যাল ইউজার ইন্টারফেস (GUI) সরিয়ে তার জায়গায় অভিপ্রায়ভিত্তিক কণ্ঠ-ইন্টারফেস বসিয়ে, Kruti চিন্তা আর বাস্তবায়নের মধ্যকার দূরত্ব ভেঙে দেয়।

এটি কেবল ভয়েস টাইপিং নয়; এটি দায়িত্ব অর্পণ। ব্যবহারকারী যখন বলেন, “এয়ারপোর্টে যাওয়ার জন্য একটা ক্যাব বুক করো,” তখন এআই ক্যাবের সংজ্ঞা খোঁজে না। বরং তাৎক্ষণিকভাবে শুরু করে একগুচ্ছ “এজেন্টিক” কাজ—ব্যবহারকারীর বর্তমান অবস্থান জানা, শহরের প্রেক্ষিতে কোনটি “এয়ারপোর্ট” তা নির্ধারণ করা, রাইড-হেইলিং API (যেমন Ola বা Uber)-এর সঙ্গে যোগাযোগ করা, প্রাপ্যতা তুলনা করা এবং বুকিং নিশ্চিত করা—সবকিছু কয়েক সেকেন্ডের মধ্যেই।

ফাঁক পূরণ: বাস্তব জগতের সঙ্গে সংযোগ

Kruti-র আসল শক্তি নিহিত রয়েছে বাইরের বিশ্বের সঙ্গে তার “হ্যান্ডশেক”-এ। নিজস্ব ইকোসিস্টেমে আটকে রাখা কোনো বদ্ধ বাগান নয়—Kruti তৈরি হয়েছে ভারতের জনপ্রিয় পরিষেবাগুলোর ওপর একটি আন্তঃসংযোগযোগ্য স্তর হিসেবে।

মোবিলিটি অ্যাজ আ সার্ভিস:
ভাড়া বা অপেক্ষার সময় জানতে একাধিক রাইড-হেইলিং অ্যাপে ঘোরাঘুরি করার দরকার নেই। Kruti নিজেই সমন্বয়কারী। “অফিসে যাওয়ার জন্য একটা অটো ডাকো”—এই একটিমাত্র নির্দেশে এজেন্ট বিভিন্ন পরিষেবা স্ক্যান করে রাইড বুক করে দেয়। লোকেশন পিন করা বা ড্রাইভার কনফার্মেশনের ঝামেলাও সে নিজেই সামলে নেয়।

Zomato ইন্টিগ্রেশন:
খাবার ডেলিভারি ‘ডুয়ার’ ক্ষমতার আদর্শ উদাহরণ। Kruti পছন্দ ও প্রেক্ষাপট বোঝে। “Paradise থেকে আমার usual বিরিয়ানি অর্ডার করো”—এই কথার মানে বুঝতে এআই-কে তিনটি বিষয় জানতে হয়: আপনার “usual” অর্ডার ইতিহাস, নির্দিষ্ট রেস্তোরাঁ “Paradise,” এবং পেমেন্ট পদ্ধতি। Zomato-এর মতো প্ল্যাটফর্মের সঙ্গে সরাসরি সংযোগ করে Kruti এই কাজটি করে দেয়—ব্যবহারকারীকে অ্যাপ খুলতেই হয় না।

ইউটিলিটি ও পেমেন্ট:
সবচেয়ে সাধারণ অথচ সবচেয়ে প্রভাবশালী ব্যবহার ক্ষেত্র হলো বিল পেমেন্ট। ডিউ ডেট মনে রাখা বা ব্যাংকিং পোর্টালে ঢোকার মানসিক চাপ এজেন্টের কাঁধে চলে যায়। “আমার বিদ্যুৎ বিলটা দিয়ে দাও”—এই নির্দেশ একটি দশ মিনিটের কাজকে বদলে দেয় একটিমাত্র যাচাইযোগ্য কর্মে।

‘অ্যাপ হপিং’-এর অবসান

এই পরিবর্তন আমাদের অপারেটিং সিস্টেম দেখার দৃষ্টিভঙ্গিকেই বদলে দেয়। এখন আমরা OS-কে দেখি অ্যাপ রাখার তাক হিসেবে। কিন্তু ‘ডুয়ার ইকোনমি’-তে OS (এজেন্টের মাধ্যমে) হয়ে ওঠে কনসিয়ার্জ। অ্যাপগুলো পেছনে সরে গিয়ে নীরব বাস্তবায়ন কেন্দ্রে পরিণত হয়—এজেন্টের অনুরোধ পূরণ করাই তাদের কাজ।

ভারতীয় ব্যবহারকারীর জন্য এটি যুগান্তকারী। ক্রমাগত বদলে যাওয়া অ্যাপ ইন্টারফেস শেখার প্রয়োজন কমে যায়। আজ Zomato বোতাম সবুজ না লাল—তা গুরুত্বপূর্ণ নয়; “খাবার অর্ডার করো”—এই নির্দেশটাই স্থায়ী।

উপসংহার: সময় ফিরে পাওয়া

শেষ পর্যন্ত, কথোপকথন থেকে বাস্তবায়নের এই যাত্রার মূল উদ্দেশ্য হলো সময় উদ্ধার করা। ইউআই-তে পথ খুঁজতে যে প্রতিটি মিনিট নষ্ট হয়, সেটাই মানুষের জন্য এক ধরনের অপ্রয়োজনীয় “অ্যাডমিন কাজ”। এই ডিজিটাল খুঁটিনাটি Kruti-র হাতে তুলে দিলে, ব্যবহারকারী প্রযুক্তির যান্ত্রিকতা থেকে মুক্ত হয়ে শুধু ফলাফলের দিকে মন দিতে পারেন।

এটাই এজেন্টিক যুগের প্রতিশ্রুতি—এমন প্রযুক্তি, যা আপনার হয়ে কাজ করে; আপনাকে প্রযুক্তির জন্য কাজ করতে হয় না।

কৃত্রিম বুদ্ধিমত্তার জন্য ‘ইউপিআই মুহূর্ত’

এক বিপ্লবের অন্তর্গঠন

Kruti-কে কৃত্রিম বুদ্ধিমত্তার জন্য “ইউপিআই মুহূর্ত” বলা কতটা তাৎপর্যপূর্ণ—তা বুঝতে হলে আগে ফিরে তাকাতে হয় ইউনিফায়েড পেমেন্টস ইন্টারফেস (UPI) কীভাবে ভারতের ডিজিটাল অর্থনীতিকে বদলে দিয়েছিল। ২০১৬ সালের আগে ভারতে ডিজিটাল ব্যাংকিং ছিল বিচ্ছিন্ন ও জটিল—বদ্ধ প্ল্যাটফর্ম, ঝামেলাপূর্ণ IFSC কোড আর সাধারণ মানুষের জন্য অনুপযোগী ইন্টারফেসে ভরা। এটি মূলত শহুরে অভিজাতদের হাতিয়ার ছিল। UPI কেবল প্রযুক্তি আপগ্রেড করেনি; সে ভেঙে দিয়েছে দেওয়ালগুলো। একটি জটিল আর্থিক ব্যবস্থাকে সে রূপান্তরিত করেছে একটি সার্বজনিক, আন্তঃসংযোগযোগ্য QR কোড স্ক্যানে—যার ফলে রাস্তার ধারে সবজি বিক্রেতাও ডিজিটাল ক্ষমতায় একজন বড় দোকানদারের সমতুল্য হয়ে উঠেছে।

এই ঠিক একই তুলনাই Krutrim টানছে Kruti-কে সামনে রেখে। গত কয়েক বছরে জেনারেটিভ এআই অনেকটা ২০১৬-পূর্ব ব্যাংকিংয়ের মতোই ছিল—অসাধারণ শক্তিশালী, কিন্তু সীমাবদ্ধ ও বাছাই করা কিছু মানুষের নাগালে। সাবস্ক্রিপশন পেওয়াল, ইংরেজি-নির্ভর জটিল ইন্টারফেস আর “প্রম্পট ইঞ্জিনিয়ারিং”-এর মতো দুর্বোধ্য দক্ষতার আড়ালে এআই ছিল মূলত সফটওয়্যার ইঞ্জিনিয়ার, কপিরাইটার আর ডেটা সায়েন্টিস্টদের হাতিয়ার।

বুদ্ধিমত্তার গণতন্ত্রীকরণ

এআই-এর “ইউপিআই মুহূর্ত” মানে হলো—একচেটিয়াতা থেকে সর্বব্যাপীতায় উত্তরণ। Kruti চায় “বুদ্ধিমত্তা”-র ক্ষেত্রে ঠিক সেটাই করতে, যা UPI করেছে “টাকা”-র জন্য: একে অদৃশ্য, তাৎক্ষণিক এবং সবার জন্য সহজলভ্য করে তোলা।

এই দৃষ্টিভঙ্গির কেন্দ্রে রয়েছে প্রযুক্তি থেকে “টেক”-এর আবরণ খুলে ফেলা। যেমন GPay ব্যবহার করতে ব্যাংকিং প্রোটোকল জানা লাগে না, তেমনই Kruti ব্যবহার করতে সাধারণ নাগরিকের লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) বোঝার দরকার হওয়া উচিত নয়। লক্ষ্য হলো উচ্চপ্রযুক্তির সুবিধাকে এমনভাবে ছড়িয়ে দেওয়া, যাতে বিদর্ভের একজন কৃষক যেমন সহজে ফসলের রোগ বিশ্লেষণে এআই ব্যবহার করতে পারেন, তেমনই বেঙ্গালুরুর একজন প্রযুক্তিবিদ কোড ডিবাগ করতে পারেন। কণ্ঠনির্ভর ও স্থানীয়কৃত মডেলের মাধ্যমে Kruti এই প্রবেশমূল্যের মানসিক খরচকে প্রায় শূন্যে নামিয়ে আনে।

আন্তঃসংযোগযোগ্যতা: সুপার-অ্যাপের লক্ষ্য

UPI-এর আসল কৃতিত্ব ছিল—এটি কাউকে ব্যাংক বদলাতে বাধ্য করেনি; বরং সব ব্যাংককে একটি ছাতার নিচে এনেছে। ভাঙাচোরা ব্যবস্থার ওপর একটি ঐক্যবদ্ধ স্তর তৈরি করাই ছিল তার সাফল্যের চাবিকাঠি। Kruti ডিজিটাল অর্থনীতিতে ঠিক তেমনই একটি স্থাপত্যগত ভূমিকা নিতে চায়।

বর্তমানে ভারতীয় ইন্টারনেট অভিজ্ঞতা টুকরো টুকরো—Amazon, Zomato, Uber, WhatsApp—প্রতিটিই আলাদা ডেটার দ্বীপ। Kruti এই সবের ওপরে একটি আন্তঃসংযোগযোগ্য স্তর হিসেবে কাজ করে—কর্মের জন্য এক ধরনের “প্রোটোকল”। বিভিন্ন অ্যাপের সঙ্গে একীভূত হয়ে, এটি ব্যবহারকারীকে এআই ইন্টারফেস ছাড়াই জটিল, বহুপ্ল্যাটফর্ম কাজ সম্পন্ন করতে দেয়। ঠিক যেমন UPI-তে একটি আইডি দিয়েই যেকোনো ব্যাংকের সঙ্গে লেনদেন সম্ভব। যদি Kruti সফল হয়, তবে স্মার্টফোন আর অ্যাপের ফোল্ডার নয়—একটি সমন্বিত পরিষেবায় রূপ নেবে।

‘সাধারণ নাগরিক’-এর ক্ষমতায়ন

এই “ইউপিআই মুহূর্ত”-এর প্রকৃত পরীক্ষা হবে অনানুষ্ঠানিক অর্থনীতিতে এর প্রভাব। UPI সফল হয়েছিল কারণ এটি ক্ষুদ্র উদ্যোক্তার জন্য কাজ করেছিল। Kruti ঠিক সেই একই জনগোষ্ঠীকেই লক্ষ্য করছে।

ভাবুন একজন ছোট ব্যবসায়ীর কথা, যিনি ইংরেজি-নির্ভর ইনভেন্টরি সফটওয়্যারে হিমশিম খান। Kruti থাকলে তিনি কণ্ঠনির্দেশে স্টক ম্যানেজ করতে পারবেন, হিন্দিতে বলে ইংরেজিতে সাপ্লায়ারকে ইমেল লিখতে পারবেন, পেমেন্ট ট্র্যাক করতে পারবেন—সবই অ্যাপের জটিলতা ছাড়াই। এটি মাঠ সমান করে দেয়, কম ডিজিটাল সাক্ষরতাসম্পন্ন মানুষকেও বড় কর্পোরেশনের মতো উৎপাদনশীলতার সুবিধা দেয়। এআই-কে আর এমন “দক্ষতার ফাঁক” হতে দেয় না যা বৈষম্য বাড়ায়; বরং একে এমন সেতুতে রূপান্তরিত করে যা বৈষম্য কমায়।

একটি পাবলিক গুড?

সব মিলিয়ে, এই তুলনা ইঙ্গিত দেয়—এআই-কে কেবল একটি বেসরকারি পণ্য হিসেবে নয়, বরং ডিজিটাল পাবলিক ইনফ্রাস্ট্রাকচার (DPI) হিসেবে দেখা উচিত। যদি Kruti, UPI-এর মতো পরিসর ও নির্ভরযোগ্যতা অর্জন করতে পারে, তবে ভারতে এআই নিয়ে ভাবনার ধরণটাই বদলে যাবে। এটি সিলিকন ভ্যালির বিলাসী ধারণা থেকে সরে এসে ভারতীয় ডিজিটাল স্ট্যাকের একটি মৌলিক ইউটিলিটিতে পরিণত হবে—সহজ, সার্বভৌম এবং অসাধারণভাবে সম্প্রসারণযোগ্য।

চূড়ান্ত ইন্টারফেস হিসেবে কণ্ঠস্বর

কীবোর্ডের বাধা

দীর্ঘ কয়েক দশক ধরে ডিজিটাল দুনিয়ায় প্রবেশের “মূল্য” হিসেবে ধরা হয়েছে সাক্ষরতাকে—বিশেষ করে পড়া, লেখা ও টাইপ করার দক্ষতাকে, যা প্রায়শই ইংরেজিনির্ভর। ভারতে আজ ৮০ কোটিরও বেশি ইন্টারনেট ব্যবহারকারী থাকলেও, তাদের একটি বড় অংশ ওয়েবের সঙ্গে যোগাযোগ করে মূলত নিষ্ক্রিয়ভাবে—ভিডিও স্ক্রল করা বা হোয়াটসঅ্যাপে ভয়েস নোট পাঠানোর মধ্যেই সীমাবদ্ধ থাকে—কারণ কীবোর্ডই একটি বড় বাধা। ছয় ইঞ্চির স্মার্টফোন স্ক্রিনে ভারতীয় লিপিতে টাইপ করা ঝামেলাপূর্ণ। মাত্রা বসানো কঠিন, আর অটোকারেক্ট প্রায়ই আঞ্চলিক ভাষার প্রতি শত্রুভাবাপন্ন।

এই সমস্যার সমাধান হিসেবে Kruti গ্রহণ করেছে “ভয়েস-ফার্স্ট” নকশা দর্শন। পাশ্চাত্য এআই মডেলগুলোর মতো টেক্সট-ভিত্তিক চ্যাটের ওপর ভয়েসকে বাড়তি ফিচার হিসেবে বসানো নয়—Kruti কণ্ঠস্বরকেই প্রাথমিক ইনপুট পদ্ধতি হিসেবে ধরে। এই সিদ্ধান্ত একটি মৌলিক ভারতীয় বাস্তবতাকে স্বীকার করে: আমরা মূলত একটি মৌখিক সংস্কৃতির মানুষ। আমরা টাইপ করার চেয়ে কথা বলতে স্বচ্ছন্দ।

প্রযুক্তিগত উদ্ভাবন: ‘ধ্বনি’ মডেল

Kruti-র সাবলীল ভয়েস ইন্টারফেসের নেপথ্যে রয়েছে ধ্বনি (Dhwani) আর্কিটেকচার—Krutrim-এর নিজস্ব স্পিচ মডেল। প্রচলিত ভয়েস অ্যাসিস্ট্যান্টে সাধারণত দুটি সমস্যা থাকে: লেটেন্সি ট্যাক্স আর অ্যাকুরেসি ট্যাক্স। আপনি কথা বললে সিস্টেম প্রথমে কণ্ঠকে লেখায় রূপান্তর করে (ASR), তারপর সেই লেখাকে প্রসেস করে উত্তর তৈরি করে, শেষে আবার অডিওতে রূপ দেয় (TTS)। এই রিলে দৌড়ের প্রতিটি ধাপে কিছু না কিছু তথ্য হারিয়ে যায়।

Kruti ব্যবহার করে একটি এন্ড-টু-এন্ড স্পিচ মডেল, যা সরাসরি অডিও প্রসেস করে। ফলে এটি কেবল শব্দ নয়, শব্দের বাইরের সংকেতও ধরতে পারে—কণ্ঠে থাকা দ্বিধা, অনুরোধের তাড়না, কিংবা প্রশ্নের ঊর্ধ্বমুখী স্বরভঙ্গি—যেগুলো টেক্সট-ভিত্তিক মডেল সহজেই মিস করে। এর ফলে কথোপকথনটা আর যন্ত্রকে নির্দেশ দেওয়ার মতো মনে হয় না; বরং সহায়ক একজন মানুষের সঙ্গে কথা বলার অভিজ্ঞতা তৈরি হয়।

কোড-সুইচিংয়ের ‘খিচুড়ি’ আয়ত্ত করা

ভারতে আগের প্রজন্মের ভয়েস অ্যাসিস্ট্যান্টগুলোর বড় ব্যর্থতা ছিল কোড-সুইচিং সামলাতে না পারা—একই বাক্যে অনায়াসে দুই বা ততোধিক ভাষা মেশানোর স্বভাব। বাস্তবে ভারতীয় ব্যবহারকারী খুব কমই খাঁটি হিন্দি বা খাঁটি ইংরেজিতে কথা বলেন। তারা বলেন হিংলিশ, ট্যাংলিশ বা বাংলিশে।

Kruti এই ভাষাগত “খিচুড়ি” বুঝতে সক্ষম করে তৈরি। একজন ব্যবহারকারী অনায়াসে বলতে পারেন—
Bangalore ka weather kaisa hai, will it rain today?
এখানে হিন্দি বাক্যগঠন আর ইংরেজি শব্দভাণ্ডার—দুটোকেই মডেল নির্বিঘ্নে বিশ্লেষণ করতে পারে। এর ফলে ব্যবহারকারীর মানসিক চাপ কমে যায়; যন্ত্রের সুবিধার জন্য ভাষা “পরিষ্কার” করে বলার দরকার পড়ে না। মানুষ যেমন স্বাভাবিকভাবে কথা বলে, তেমনভাবেই কথা বলা যায়।

পরবর্তী এক বিলিয়নের জন্য প্রবেশগম্যতা

এই ইন্টারফেসের প্রভাব কেবল আরামের মধ্যে সীমাবদ্ধ নয়; এটি ডিজিটাল অন্তর্ভুক্তির প্রশ্ন। জটিল গ্রাফিক্যাল ইউজার ইন্টারফেস (GUI) এড়িয়ে গিয়ে Kruti কম ডিজিটাল সাক্ষরতাসম্পন্ন মানুষদের ক্ষমতায়িত করে।

ভাবুন একজন প্রবীণ নাগরিকের কথা—ছোট ফন্ট আর বিভ্রান্তিকর আইকনের কারণে যিনি ব্যাংকিং অ্যাপ ব্যবহার করতে ভয় পান। Kruti থাকলে তাঁর কাজটা নেমে আসে একটি মৌখিক নির্দেশে:
Electricity bill bhar do” (বিদ্যুৎ বিলটা দিয়ে দাও)।
এরপর নেভিগেশন, নির্বাচন ও কনফার্মেশনের সব দায়িত্ব এআই নিজেই সামলে নেয়। কণ্ঠস্বর হয়ে ওঠে মহান সমতাকারী—গ্রামের এক দিদিমাকেও দেয় মহানগরের একজন সফটওয়্যার ইঞ্জিনিয়ারের মতোই আধুনিক পরিষেবার ওপর নিয়ন্ত্রণ।

ইন্টিগ্রেশন ইকোসিস্টেম: অ্যাপ ও ইউটিলিটির সংযোগ

বদ্ধ বাগানের সমস্যা

আধুনিক স্মার্টফোন অভিজ্ঞতা এক অদ্ভুত বৈপরীত্যে ভরা। আমাদের কাছে প্রায় সব কিছুর জন্যই আলাদা আলাদা অ্যাপ আছে, অথচ এই অ্যাপগুলো কাজ করে “বদ্ধ বাগান”-এর মতো—ডেটার বিচ্ছিন্ন দুর্গ, যেগুলো একে অপরের সঙ্গে খুব কমই কথা বলে। ধরুন একটি ডিনার ডেট পরিকল্পনার কথা—সময় ঠিক করতে মেসেজিং অ্যাপ, টেবিল বুক করতে রিজার্ভেশন অ্যাপ, সেখানে যেতে রাইড-হেইলিং অ্যাপ, আর শেষে বিল মেটাতে পেমেন্ট অ্যাপ—একটির পর একটি বদলাতে হয়। ঘর্ষণ এতটাই বেশি যে মানুষকেই হাতে-কলমে ডেটা সেতু হতে হয়—ঠিকানা আর সময় কপি-পেস্ট করে ঘুরে বেড়াতে হয় নানা ইন্টারফেসে।

এই ভাঙাচোরা ব্যবস্থায় Kruti প্রবেশ করে আরেকটি অ্যাপ হিসেবে নয়, বরং সংযোগকারী টিস্যু হিসেবে। এর স্থাপত্য এমনভাবে নকশা করা, যাতে এই দেয়ালগুলো গলে যায়। একটি অর্কেস্ট্রেশন স্তর হিসেবে কাজ করে Kruti এমন একটি ইকোসিস্টেম গড়ে তোলে, যেখানে ইউটিলিটি ও পরিষেবাগুলো আলাদা আলাদা আইকনের সমষ্টি না হয়ে একটি একটানা, সাবলীল ধারায় পরিণত হয়।

API সিম্ফনির অর্কেস্ট্রেশন

প্রযুক্তিগত স্তরে, Kruti এই কাজটি করে উন্নত API (Application Programming Interface) অর্কেস্ট্রেশনের মাধ্যমে। ব্যবহারকারী যখন বলেন, “এয়ারপোর্টে যাওয়ার জন্য একটা ক্যাব বুক করো,” তখন এআই হঠাৎ করেই গাড়ি হাজির করে না। সে কাজ করে একজন দক্ষ অনুবাদকের মতো।

  • উদ্দেশ্য বিশ্লেষণ (Intent Parsing): মানুষের অস্পষ্ট অনুরোধকে রূপ দেয় নির্দিষ্ট ও কাঠামোবদ্ধ ডেটা কোয়েরিতে।
  • হ্যান্ডশেক: নিরাপদ API ব্যবহার করে পার্টনার প্ল্যাটফর্মগুলোর সঙ্গে “হাত মেলায়”—হোক সেটা রাইডের জন্য Ola নেটওয়ার্ক, কিংবা ইউটিলিটির জন্য BBPS (ভারত বিল পেমেন্ট সিস্টেম)।
  • প্রেক্ষিত মানচিত্রায়ন (Contextual Mapping): প্রয়োজনীয় তথ্য—পিকআপ লোকেশন, গাড়ির ধরন, কনজিউমার নম্বর—ব্যবহারকারীর বিদ্যমান প্রেক্ষিত থেকে নিজে থেকেই পূরণ করে।

এই সক্ষমতাই Kruti-কে ব্লোট ছাড়া সুপার-অ্যাপ বানায়। মানচিত্র বা ব্যাংকিং সিস্টেম নতুন করে বানানোর দরকার তার নেই; শুধু সেগুলোর সঙ্গে সাবলীলভাবে কথা বলার ক্ষমতাই যথেষ্ট। ভারতের ডিজিটাল অর্থনীতির বিদ্যমান শক্ত অবকাঠামোকে কাজে লাগিয়ে, Kruti সেখান থেকে জটিল ইউজার ইন্টারফেসের আবরণ সরিয়ে দেয়।

নিরাপত্তা: আস্থার স্থাপত্য

যেকোনো এজেন্টিক এআই-এর জন্য সবচেয়ে বড় চ্যালেঞ্জ হলো আস্থা। টাকা খরচ করা বা ডেটায় প্রবেশের ক্ষমতা একটি অ্যালগরিদমের হাতে তুলে দিতে হলে, নিরাপত্তা ব্যবস্থাকে হতে হয় আপসহীন। Kruti এই চ্যালেঞ্জের জবাব দেয় “লিস্ট প্রিভিলেজ”“হিউম্যান-ইন-দ্য-লুপ” যাচাইয়ের দর্শনের মাধ্যমে।

স্যান্ডবক্সড এক্সিকিউশন:
তৃতীয় পক্ষের অ্যাপের সঙ্গে সব যোগাযোগ হয় নিরাপদ, স্যান্ডবক্সড পরিবেশে। Kruti যখন কোনো ফুড ডেলিভারি সার্ভিসে প্রবেশ করে, তখন সে ব্যবহারকারীর সম্পূর্ণ ডিজিটাল পরিচয় হস্তান্তর করে না। শুধু একান্ত প্রয়োজনীয় ডেটা টোকেন—অর্ডারের বিবরণ ও ডেলিভারি লোকেশন—পাস করে; বাকি প্রোফাইল আড়ালেই থাকে।

চূড়ান্ত সম্মতি:
সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো—Kruti সংবেদনশীল কাজের উদ্যোক্তা, কিন্তু চূড়ান্ত অনুমোদনকারী নয়। আর্থিক লেনদেনের ক্ষেত্রে এআই মঞ্চ প্রস্তুত করে—বিল আনে, ব্যাংক নির্বাচন করে, পেমেন্ট সেটআপ করে—কিন্তু শেষ ধাপে এসে থেমে যায়। চূড়ান্ত “এক্সিকিউট” নির্দেশ—যা সাধারণত UPI পিন বা বায়োমেট্রিক অথেনটিকেশন—সম্পূর্ণভাবে মানুষের হাতেই থাকে। এতে পরিশ্রম কমে, কিন্তু কর্তৃত্ব কখনোই এআই দখল করে না।

টোকেনাইজেশন:
আর্থিক তথ্য সুরক্ষিত রাখতে Kruti সম্ভবত বড় পেমেন্ট গেটওয়েগুলোর মতোই টোকেনাইজেশন মানদণ্ড ব্যবহার করে। এটি কাঁচা কার্ড নম্বর বা ব্যাংক পাসওয়ার্ড সংরক্ষণ করে না। বরং এনক্রিপ্টেড টোকেন ব্যবহার করে, যা মাঝপথে ধরা পড়লেও অর্থহীন—ফলে এআই এজেন্টে কোনো ফাঁক মানেই ব্যবহারকারীর ব্যাংক অ্যাকাউন্টে ফাঁক নয়।

পরিষেবা হিসেবে নির্বিঘ্নতা

এই সমন্বয়ের ফলাফল হলো এমন এক ব্যবহারকারী অভিজ্ঞতা, যা “কম্পিউটার ব্যবহার”-এর চেয়ে বেশি মনে হয় “একজন সেক্রেটারি থাকা”। লগইন করা, পাসওয়ার্ড মনে রাখা বা মেনু ঘাঁটার ঘর্ষণ—সবটাই এজেন্ট নিজের কাঁধে নিয়ে নেয়।

অ্যাপ অর্থনীতির বিচ্ছিন্ন দানাগুলোকে নিরাপদে এক সুতোয় গেঁথে, Kruti স্মার্টফোনকে বিভ্রান্তির যন্ত্র থেকে বদলে দেয় সরাসরি কাজের হাতিয়ারে। এটি প্রমাণ করে—সফটওয়্যারের ভবিষ্যৎ আরও বেশি অ্যাপে নয়; বরং এমন এক বুদ্ধিমত্তায়, যা আপনার হয়ে সব অ্যাপ ব্যবহার করতে পারে।

স্থানীয় প্রেক্ষাপট বনাম বৈশ্বিক জায়ান্টরা
আইভরি টাওয়ার আর বাজার

কৃত্রিম বুদ্ধিমত্তার প্রতিযোগিতামূলক পরিসর বুঝতে হলে আগে একটি সূক্ষ্ম পার্থক্য টানতে হয়—“ইন্টেলিজেন্স” আর “উইজডম”-এর মধ্যে। OpenAI (ChatGPT), Google (Gemini) কিংবা Anthropic (Claude)-এর মতো বৈশ্বিক জায়ান্টরা গড়ে তুলেছে ডিজিটাল যুগের “আইভরি টাওয়ার”। তাদের রয়েছে বিশ্বকোষসম জ্ঞান, পিএইচডি-সমতুল্য যুক্তি করার ক্ষমতা এবং আনুষ্ঠানিক যুক্তিবিদ্যায় দক্ষতা। এরা প্রশিক্ষিত হয়েছে “পরিষ্কার” ইন্টারনেটে—গোছানো ডেটাসেট, একাডেমিক পেপার আর পাশ্চাত্য মিডিয়ার ওপর।

এর বিপরীতে, Kruti তৈরি হয়েছে “বাজার”-এর জন্য। এটি ভারতের অগোছালো, প্রাণবন্ত ও অনিয়ন্ত্রিত বাস্তবতার উপযোগী করে নকশা করা। যেখানে কোনো বৈশ্বিক মডেল ফরাসিতে আরও নিখুঁত সনেট লিখতে পারে, সেখানে Kruti মুম্বাইয়ের অটো-রিকশার ভাড়া দরদাম করতে বেশি পারদর্শী। এখানে কৌশলটা কাঁচা গণনাশক্তিতে জায়ান্টদের হারানো নয়; বরং প্রেক্ষাপটগত প্রাসঙ্গিকতায় তাদের ছাপিয়ে যাওয়া।

‘জিপ কোড’ ভ্রান্তি: ল্যান্ডমার্কের দেশে লজিস্টিকস

এই এজেন্টগুলোর মধ্যে সবচেয়ে স্পষ্ট পার্থক্য ধরা পড়ে তারা বাস্তব জগতকে কীভাবে দেখে—সে বিষয়ে। পাশ্চাত্য এআই মডেলগুলো চলে কাঠামোবদ্ধ যুক্তিতে। আপনি যদি কোনো বৈশ্বিক এজেন্টকে বলেন, “১২৩ মেপল অ্যাভিনিউতে নিয়ে চলো,” সে নির্ভর করে নির্ভুল জিওকোডিং, মানসম্মত রাস্তার নাম আর কড়া ট্রাফিক লেনের ওপর।

কিন্তু ভারত চলে “ল্যান্ডমার্ক লজিক”-এ। এখানে ঠিকানা প্রায়ই সংখ্যার চেয়ে বর্ণনাধর্মী—“হনুমান মন্দিরের পেছনে, নীল গেটের কাছে, দ্বিতীয় তলা।” বৈশ্বিক মডেলগুলো এমন তথ্যকে প্রায়ই “অবৈধ” বা “অপর্যাপ্ত” বলে বাতিল করে। ভারতীয় ভূ-স্থানিক সূক্ষ্মতায় প্রশিক্ষিত Kruti বুঝতে পারে—এটাই ঠিকানা। “ডেলিভারি ড্রাইভার থেকে দুই মিনিট দূরে” মানে আসলে দশ মিনিট—এই কথ্য বাস্তবতা, কিংবা “ফ্লাইওভারের কাছে” বলতে যে মানচিত্রে নেই এমন একটি নির্দিষ্ট পিকআপ পয়েন্ট বোঝায়—এসব অগোছালো নির্দেশও Kruti অনায়াসে ধরতে পারে।

সাংস্কৃতিক হ্যালুসিনেশন বনাম মাটিতে পা রাখা বাস্তবতা

বৈশ্বিক মডেলগুলো তাদের অ্যালাইনমেন্টে প্রায়ই এক ধরনের পাশ্চাত্য পক্ষপাত বহন করে। ভদ্রতা, খাদ্যাভ্যাস আর সামাজিক কাঠামো—সবই মূলত আমেরিকান সাংস্কৃতিক মানদণ্ডে সূক্ষ্মভাবে টিউন করা। ভারতে প্রয়োগ হলে এর ফল হয় “সাংস্কৃতিক হ্যালুসিনেশন”

উদাহরণস্বরূপ, কেউ যদি কোনো বৈশ্বিক এজেন্টকে বলে, “আমার নিরামিষভোজী বাবা-মায়ের জন্য ডিনারের পরিকল্পনা করো,” সে হয়তো “ভেগান অপশন” আছে এমন রেস্তোরাঁ সাজেস্ট করবে—কিন্তু অনেক রক্ষণশীল ভারতীয় পরিবারের জন্য যে “পিওর ভেজ” রান্নাঘর অপরিহার্য, যেখানে এমনকি বাসনপত্র ভাগাভাগিও সমস্যা—এই সূক্ষ্মতা ধরতে পারবে না। Kruti এই ঘর্ষণ কমায়। সে বোঝে—ভারতে “ভেজ” কেবল খাদ্যপছন্দ নয়; এটি ধর্মীয় বা সাংস্কৃতিক অনুশীলন। সে বোঝে—“বিয়ে” মানে শুধু অনুষ্ঠান আর রিসেপশন নয়; বহুদিনব্যাপী নির্দিষ্ট আচার-অনুষ্ঠানের সমষ্টি। এই সাংস্কৃতিক “API” Kruti-কে সামাজিকভাবে নিরাপদ ও প্রাসঙ্গিক সুপারিশ দিতে সক্ষম করে—যেখানে বৈশ্বিক জায়ান্টদের প্রস্তাব অনেক সময় বেমানান শোনায়।

ভাষাগত ‘আনক্যানি ভ্যালি’

বৈশ্বিক মডেলগুলো হিন্দিতে অনেক উন্নতি করলেও, তাদের ভাষা প্রায়ই পাঠ্যবইয়ের মতো—ব্যাকরণে নিখুঁত, কিন্তু সামাজিকভাবে অস্বস্তিকর। কোড-সুইচিং-এর টেক্সচার সেখানে অনুপস্থিত।

ভারতীয় কথাবার্তা তরল। একটি বাক্যেই হিন্দির ব্যাকরণ, ইংরেজি বিশেষ্য আর আঞ্চলিক স্ল্যাং মিশে যায়। “Scene kya hai, are we meeting?”—বেঙ্গালুরু বা দিল্লিতে এটি একেবারেই স্বাভাবিক। বৈশ্বিক মডেলগুলো প্রায়ই এটাকে এক ভাষায় ঠেলে দিতে চায়, ফলে আসল উদ্দেশ্য হারিয়ে যায়। Kruti এই ভাষাগত মিশ্রণেই স্বচ্ছন্দ। সে হিংলিশকে সংশোধনের ভুল হিসেবে নয়, বরং আয়ত্ত করার মতো একটি উপভাষা হিসেবে দেখে। তাই কথোপকথন অনুবাদের মতো নয়, বরং স্বদেশি মনে হয়।

ডেটা সার্বভৌমত্ব: আস্থার প্রশ্ন

শেষত, কৌশলগত পার্থক্য তৈরি করে সার্বভৌমত্ব। এআই যখন ব্যাংকিং, স্বাস্থ্যসেবা আর ব্যক্তিগত জীবনের গভীরে ঢুকছে, তখন “আমার ডেটা কোথায় যাচ্ছে?”—এই প্রশ্নটি অত্যন্ত গুরুত্বপূর্ণ হয়ে ওঠে। বৈশ্বিক জায়ান্টদের বেশিরভাগই ডেটা প্রসেস করে যুক্তরাষ্ট্র বা ইউরোপের সার্ভারে—যা বিদেশি আইনব্যবস্থার অধীন।

Krutrim এখানে Kruti-কে তুলে ধরে একটি “স্বদেশি” বিকল্প হিসেবে। প্রশিক্ষণ থেকে ইনফারেন্স—ডেটার পুরো জীবনচক্র ভারতে রাখার প্রতিশ্রুতি দিয়ে, এটি সরকারী নিয়ন্ত্রক সংস্থা ও গোপনীয়তা-সচেতন সংস্থাগুলোর আস্থা অর্জন করে। এর বার্তা স্পষ্ট—ভারতের ডিজিটাল এক্সহস্ট ব্যবহার হবে ভারতের ভবিষ্যৎ মডেল তৈরিতে, সিলিকন ভ্যালির অ্যালগরিদম পালিশে নয়।

সাধারণীকরণের চেয়ে বিশেষায়ন

শেষ পর্যন্ত, Kruti-র সাফল্যের জন্য GPT-4-এর চেয়ে জ্যোতির্বিদ্যা বা কোডিংয়ে “বুদ্ধিমান” হওয়া জরুরি নয়। তার দরকার শুধু ভারতীয় ব্যবহারকারীর কাছে বেশি উপযোগী হওয়া। ট্রাফিক, ভাষা, পেমেন্ট আর সংস্কৃতি—ভারতীয় জীবনের এই নির্দিষ্ট ঘর্ষণবিন্দুগুলোর ওপর মনোযোগ দিয়ে, Kruti এমন এক জগতে জয়ী হতে চায় যেখানে সবাই জেনারালিস্ট—আর সে নিজে স্পেশালিস্ট।

ইনফ্রাস্ট্রাকচার স্কেলিং: চ্যালেঞ্জ ও সম্ভাবনা
কণ্ঠস্বরের আড়ালে ভারী পরিশ্রম

সাধারণ ব্যবহারকারীর চোখে Kruti মানে স্মার্টফোনে শোনা এক বন্ধুসুলভ কণ্ঠ। কিন্তু একজন সিস্টেম আর্কিটেক্টের কাছে Kruti এক ভয়ংকরভাবে জটিল শিল্পকারখানা। এজেন্টিক এআই সাধারণ চ্যাটবটের তুলনায় বহুগুণ বেশি রিসোর্স-নির্ভর। যেখানে একটি চ্যাটবট শুধু টেক্সট প্রসেস করে (কম ব্যান্ডউইথ), সেখানে Kruti-এর মতো এজেন্টকে একসঙ্গে করতে হয়—রিয়েল-টাইম অডিও গ্রহণ, ট্রান্সক্রিপশন, উদ্দেশ্য বিশ্লেষণ, API কল চালানো, উত্তর তৈরি এবং আবার কণ্ঠে রূপান্তর—সবকিছু মিলিসেকেন্ডের মধ্যে।

১.৪ বিলিয়ন মানুষের জন্য এই মাল্টি-মোডাল পাইপলাইন স্কেল করা ভারতীয় উপমহাদেশে এমন সব প্রকৌশল চ্যালেঞ্জ নিয়ে আসে, যা অন্য অঞ্চলের থেকে আলাদা।

চ্যালেঞ্জ ১: লেটেন্সি ট্যাক্স ও “লাস্ট মাইল”

সিলিকন ভ্যালিতে লেটেন্সি মাপা হয় ফাইবার-অপটিক লাইনে মিলিসেকেন্ডে। ভারতে লেটেন্সি নির্ভর করে টিয়ার-২ ও টিয়ার-৩ শহরে 4G/5G নেটওয়ার্কের ওঠানামা করা স্থিতিশীলতার ওপর।

ভয়েস এজেন্টের ক্ষেত্রে বিরক্তির সীমা খুব কম। ব্যবহারকারী যদি বলেন, “একটা ক্যাব বুক করো,” আর তিন সেকেন্ড নীরবতা থাকে—তাহলে বুদ্ধিমত্তার ভ্রম ভেঙে যায়। Krutrim এখানে মোকাবিলা করে “রাউন্ড-ট্রিপ” চ্যালেঞ্জ—

  • ASR (Automatic Speech Recognition): বিহারের কোনো গ্রাম থেকে কণ্ঠস্বর মুম্বাইয়ের ডেটা সেন্টারে যায় টেক্সটে রূপান্তরের জন্য।
  • Inference: বিশাল LLM অনুরোধটি প্রসেস করে।
  • TTS (Text-to-Speech): তৈরি হওয়া টেক্সট আবার অডিওতে বদলে ব্যবহারকারীর কাছে ফেরত আসে।

এটির মোকাবিলায় Krutrim জোর দিচ্ছে এজ কম্পিউটিং-এ। মডেলের হালকা, ডিস্টিলড সংস্করণ ব্যবহারকারীর কাছাকাছি (লোকাল টাওয়ার বা এমনকি ডিভাইসের সিলিকনে) নিয়ে এসে, সহজ কমান্ডগুলো ডেটা দূরে না পাঠিয়েই প্রসেস করার লক্ষ্য নেওয়া হয়েছে।

চ্যালেঞ্জ ২: বুদ্ধিমত্তার তাপগতিবিদ্যা

এআই মডেল প্রচণ্ড গরম তৈরি করে। এই মডেল ট্রেন ও রান করতে ব্যবহৃত NVIDIA H100 ক্লাস্টার বিপুল তাপ উৎপন্ন করে। ভারতের উষ্ণ জলবায়ুতে বিশাল ডেটা সেন্টার চালানো মানে এক ধরনের “থার্মোডাইনামিক ট্যাক্স”—যা শীতল অঞ্চলের দেশগুলোর নেই।

এই স্থাপনাগুলো ঠান্ডা রাখতে প্রায় কম্পিউটিংয়ের সমান বিদ্যুৎ লাগে। Krutrim-এর অবকাঠামো রোডম্যাপে রয়েছে লিকুইড কুলিং-এ রূপান্তর—যা প্রচলিত এয়ার কন্ডিশনিংয়ের তুলনায় অনেক বেশি কার্যকর। পাশাপাশি, পুনর্নবীকরণযোগ্য শক্তিতে সমৃদ্ধ অঞ্চলে ভবিষ্যৎ ডেটা সেন্টার স্থাপনের কৌশল নেওয়া হচ্ছে—বিদ্যুৎ খরচের চ্যালেঞ্জকে সবুজ উদ্ভাবনের সুযোগে রূপান্তর করতে।

হার্ডওয়্যার সার্বভৌমত্ব: NVIDIA নির্ভরতা ভাঙা

বর্তমানে বৈশ্বিক এআই ইকোসিস্টেম কার্যত NVIDIA-র ওপর নির্ভরশীল—GPU হার্ডওয়্যার ছাড়া গতি নেই। এতে সরবরাহ শৃঙ্খলে জট ও বিপুল খরচ তৈরি হয়।

ভাবিশ আগরওয়ালের দীর্ঘমেয়াদি দৃষ্টিভঙ্গিতে রয়েছে “Krutrim Silicon”-এ কৌশলগত মোড়। সংস্থা নিজস্ব এআই-নির্দিষ্ট চিপ (সম্ভাব্য নাম “Bodhi”) নকশা ও উৎপাদনের পরিকল্পনা ঘোষণা করেছে। এটি সফল হলে—চিপ, ক্লাউড ও মডেল—সবকিছুর ওপর মালিকানা নিয়ে ভার্টিক্যাল ইন্টিগ্রেশন তৈরি হবে; ঠিক অ্যাপলের কৌশলের মতো। এতে ইনফারেন্সের খরচ উল্লেখযোগ্যভাবে কমবে এবং বৈশ্বিক সাপ্লাই-চেইন ধাক্কা থেকে ভারত অনেকটাই সুরক্ষিত থাকবে।

চ্যালেঞ্জ ৩: “ইস্ট–ওয়েস্ট” ট্রাফিক জ্যাম

প্রচলিত ওয়েব হোস্টিংয়ে ট্রাফিক মূলত নর্থ–সাউথ (ক্লায়েন্ট থেকে সার্ভার)। কিন্তু এজেন্টিক এআই-এ ট্রাফিক বেশি ইস্ট–ওয়েস্ট (সার্ভার থেকে সার্ভার)। একটি ব্যবহারকারী অনুরোধ থেকেই ভাষা মডেল, ভিশন মডেল, পেমেন্ট গেটওয়ে ও ম্যাপ সার্ভিসের মধ্যে শত শত অভ্যন্তরীণ মাইক্রো-কমিউনিকেশন শুরু হতে পারে।

এটি স্কেল করতে ডেটা সেন্টার নেটওয়ার্কিংকে নতুনভাবে ভাবতে হয়। Krutrim এখানে উচ্চক্ষমতার InfiniBand নেটওয়ার্ক মোতায়েন করছে, যাতে এআই-এর অভ্যন্তরীণ “ভাবনা”গুলো তাৎক্ষণিক ঘটে। চ্যালেঞ্জ হলো—ব্যবহারকারী সংখ্যা মিলিয়ন থেকে শত মিলিয়নে বাড়লেও এই গতি ধরে রাখা।

সুযোগ: “লিপফ্রগ” প্রভাব

এই সব বাধা সত্ত্বেও সুযোগটি কাঠামোগত। যেমন ভারত ল্যান্ডলাইন এড়িয়ে সরাসরি মোবাইলে লাফ দিয়েছিল, তেমনই লিগ্যাসি ক্লাউড এড়িয়ে সরাসরি এআই-নেটিভ ক্লাউড-এ যাওয়ার সম্ভাবনা রয়েছে।

Krutrim-এর AI Cloud কেবল ভিন্ন লোগো লাগানো AWS নয়; এটি সম্ভাবনামূলক (probabilistic) ওয়ার্কলোডের জন্য শূন্য থেকে তৈরি। ভারতীয় বাজারের কঠিন বাস্তবতা—অস্থির ইন্টারনেট, তাপমাত্রা, বহুভাষা—সমাধান করতে গিয়ে Krutrim এমন এক স্থিতিস্থাপকতা গড়ে তোলে, যা পাশ্চাত্যের “ফেয়ার-ওয়েদার” মডেলগুলোর নাও থাকতে পারে। যদি Kruti উত্তরপ্রদেশের গ্রামীণ এলাকায় কাঁপা 4G সংযোগেও নির্বিঘ্নে কাজ করতে পারে—তবে সে যেকোনো জায়গায় কাজ করতে পারবে।

আগামীর পথচলা: ভারতের ডিজিটাল প্রেক্ষাপটের রূপান্তর
নতুনত্ব থেকে অপরিহার্যতায়

Kruti-এর প্রাথমিক উদ্বোধনের উত্তেজনা স্তিমিত হতেই আলোচনার কেন্দ্র বদলে যায়—“এখন এটি কী করতে পারে?” থেকে “এটি ভবিষ্যতে কী হয়ে উঠবে?”। Krutrim-এর রোডম্যাপ কেবল একটি ভয়েস অ্যাসিস্ট্যান্টকে ঘষেমেজে উন্নত করার গল্প নয়; এটি ভারতের ইন্টারনেটের ভবিষ্যৎকে স্থাপত্যগতভাবে গড়ে তোলার পরিকল্পনা। আমরা ডিজিটাইজেশন-এর যুগ (মানুষকে অনলাইনে আনা) ছেড়ে এগোচ্ছি ইন্টেলিজাইজেশন-এর যুগে—যেখানে অনলাইন অভিজ্ঞতাকে মানুষের জন্য কার্যকর করে তোলাই মুখ্য।

বিবর্তন: প্রতিক্রিয়াশীলতা থেকে প্রোঅ্যাকটিভতায়

Kruti-এর নিকট ভবিষ্যৎ নিহিত আছে প্রতিক্রিয়াশীল আনুগত্য থেকে প্রোঅ্যাকটিভ সহায়তায় রূপান্তরে। এখন এজেন্ট অপেক্ষা করে নির্দেশের—“টিকিট বুক করো।” পরবর্তী ধাপে Kruti সম্ভবত প্রেডিক্টিভ এআই কাজে লাগাবে। ক্যালেন্ডার, ট্রাফিক ডেটা ও আবহাওয়ার সতর্কতা—এমন নানা প্যাটার্ন বিশ্লেষণ করে এজেন্ট প্রয়োজন আগেভাগেই আঁচ করতে শিখবে।

ভাবুন, Kruti আপনাকে দশ মিনিট আগে ঘুম থেকে জাগিয়ে দিল—কারণ সে বুঝেছে ভারী বৃষ্টি ও নিয়মিত রুটে ট্রাফিক বেড়েছে—এবং সময়মতো পৌঁছনোর জন্য আগেভাগেই একটি ক্যাব বুক করে দিল। এতে এজেন্ট আর কেবল একটি টুল থাকে না; সে হয়ে ওঠে আপনার সময়ের অভিভাবক।

এছাড়া Kruti-এর সংবেদনশীল ক্ষমতাও বাড়বে। আমরা এগোচ্ছি এক মাল্টিমোডাল ভবিষ্যৎ-এর দিকে—যেখানে Kruti শুধু “শুনবে” না, “দেখবে”-ও। স্মার্টফোন ক্যামেরা ব্যবহার করে এটি পাতার ছবি স্ক্যান করেই কৃষককে ফসলের রোগ শনাক্তে সাহায্য করতে পারে, কিংবা দৃষ্টিপ্রতিবন্ধী ব্যবহারকারীকে আশপাশের পরিবেশ রিয়েল-টাইমে স্থানীয় ভাষায় বর্ণনা করে দিতে পারে।

অর্থনৈতিক প্রভাব: উৎপাদনশীলতার গুণক

ব্যাপকভাবে গ্রহণযোগ্য এজেন্টিক এআই-এর সামষ্টিক অর্থনৈতিক প্রভাব গভীর। অর্থনীতিবিদরা ভারতের অনানুষ্ঠানিক খাতে এক বিশাল “উৎপাদনশীলতা-ঝাঁকুনি” (Productivity Shock) হওয়ার পূর্বাভাস দিচ্ছেন।

ভাবুন লক্ষ লক্ষ ক্ষুদ্র ও মাঝারি উদ্যোগের কথা—কিরানা দোকান, তাঁতি, ফ্রিল্যান্স মেকানিক। সফটওয়্যারের জটিলতার কারণে তারা দীর্ঘদিন ডিজিটাল দক্ষতার সুফল থেকে বঞ্চিত ছিল। Kruti এই ক্ষুদ্র উদ্যোগগুলোর জন্য এক ধরনের চিফ অপারেটিং অফিসার-এর ভূমিকা নিতে পারে। দোকানদার যদি নিজের মাতৃভাষায় কণ্ঠ-নির্দেশেই ইনভেন্টরি সামলাতে পারেন, জিএসটি রিটার্ন দাখিল করতে পারেন, সাপ্লায়ারের সঙ্গে দাম দরদাম করতে পারেন—তবে ব্যবসার ঘর্ষণ নাটকীয়ভাবে কমে যায়। কর্পোরেট-স্তরের দক্ষতার এই গণতন্ত্রীকরণ ভারতের ৫ ট্রিলিয়ন ডলারের অর্থনীতি লক্ষ্য পূরণে উল্লেখযোগ্য অবদান রাখতে পারে।

চাকরির বাজার: বিঘ্ন ও সৃজন

তবে পথটি গর্তহীন নয়। এজেন্টিক এআই-এর উত্থান অনিবার্যভাবেই বিঘ্ন ঘটাবে ভারতের ঐতিহ্যবাহী কর্মসংস্থান খাত বিপিও (BPO)-তে। Kruti-এর মতো এজেন্ট যখন লেভেল-১ কাস্টমার সাপোর্ট, ডেটা এন্ট্রি বা মৌলিক শিডিউলিং সামলাতে পারবে, তখন মানুষের কাজকে মূল্যশৃঙ্খলের উঁচু ধাপে সরে যেতে হবে।

Krutrim-এর রোডম্যাপ ইঙ্গিত দেয় “হিউম্যান–এআই সহযোগিতা”-র ভবিষ্যতের দিকে—প্রতিস্থাপনের নয়। অর্থনীতিতে দেখা যাবে “এআই সুপারভাইজার”-এর উত্থান—যারা ডিজিটাল এজেন্টদের দল পরিচালনা করবেন—এবং “ফিজিক্যাল ইকোনমি”-তে (নার্সিং, নির্মাণ, বিশেষায়িত হস্তশিল্প) চাহিদা বাড়বে, যেখানে রোবোটিক সক্ষমতা এখনো মানুষের দক্ষতার সমকক্ষ নয়।

Krutrim-এর রোডম্যাপ: ফুল-স্ট্যাক উচ্চাকাঙ্ক্ষা

সবশেষে, একটি কোম্পানি হিসেবে Krutrim-এর দীর্ঘমেয়াদি দৃষ্টিভঙ্গি Kruti অ্যাপের অনেক ঊর্ধ্বে। ভাবিশ আগরওয়াল ইঙ্গিত দিয়েছেন ভার্টিক্যাল সার্বভৌমত্ব-এর লক্ষ্যে—অর্থাৎ পুরো স্ট্যাকের নিয়ন্ত্রণ:

  • সিলিকন: বিদেশি হার্ডওয়্যারের ওপর নির্ভরতা কমাতে “Bodhi” পরিবারভুক্ত এআই চিপ তৈরি।
  • ক্লাউড: অন্যান্য ভারতীয় স্টার্টআপের জন্য “Serverless AI” দিতে এআই-নেটিভ ডেটা সেন্টার নির্মাণ।
  • মডেল: ক্রমাগত আরও বড় ও সূক্ষ্ম ফাউন্ডেশনাল মডেল (Krutrim Pro/Ultra) প্রশিক্ষণ—যা GPT-5-এর মতো বৈশ্বিক মানদণ্ডের সঙ্গে পাল্লা দিতে পারে।

উপসংহার: পুনরুদ্ধার করা নিয়তি

Kruti-এর উদ্বোধন এক বৃহত্তর গল্পের প্রথম অধ্যায়—ভারতের “ডিজিটাল কলোনি” (বিদেশি প্রযুক্তি জায়ান্টদের জন্য ডেটা খনন) থেকে “ডিজিটাল সুপারপাওয়ার”-এ উত্তরণের গল্প।

এই প্রথম, ভারত কেবল প্রযুক্তি গ্রহণ করছে না; সে প্রযুক্তির সংজ্ঞাই দিচ্ছে। সামনে চ্যালেঞ্জ আছে—লেটেন্সি, শক্তি, নৈতিকতা, চাকরি—কিন্তু গন্তব্য স্পষ্ট। খুব শিগগিরই, কোনো প্রত্যন্ত গ্রামের এক শিশু যখন ডিজিটাল শূন্যতায় প্রশ্ন ছুড়ে দেবে, তখন যে কণ্ঠস্বর উত্তর দেবে—তা ক্যালিফোর্নিয়া থেকে প্রতিধ্বনি হয়ে আসবে না; আসবে ঘরের মতো চেনা এক কণ্ঠে।

Krutrim Kruti Launch Agentic AI India Bhavish Aggarwal Make in India AI Kruti vs ChatGPT Voice AI Assistant India Tech News 2026 Sovereign AI Krutrim Silicon AI Revolution India Localized AI Model UPI for AI Artificial Intelligence Trends Ola Krutrim Digital India 2026 AI for Bharat Generative vs Agentic Tech Startup India Multilingual AI Future of Work India

Leave a Comment