বাংলাদেশের এআই প্রযুক্তিতে নতুন সংযোজন হিসেবে ডিপসিক নিয়ে এসেছে তাদের আধুনিক টুল ডিপসিক ওসিআর (DeepSeek OCR)। এটি এমন একটি কৃত্রিম বুদ্ধিমত্তা-নির্ভর প্রযুক্তি, যা যেকোনো নথির ছবি থেকে লেখা দ্রুত এবং নির্ভুলভাবে শনাক্ত করতে সক্ষম। বই, পত্রিকা, প্রতিবেদন বা স্লাইড — সব ধরনের নথি বিশ্লেষণ করতে পারে এই সিস্টেমটি।
স্মার্ট টোকেন ব্যবহারের কৌশল
ডিপসিক ওসিআর নথির জটিলতার ওপর ভিত্তি করে টোকেন ব্যবহার করে, ফলে গতি ও নির্ভুলতা দুই-ই বজায় থাকে। সংক্ষিপ্ত প্রতিবেদন বা স্লাইড প্রক্রিয়াজাত করতে যেখানে মাত্র ৬৪ টোকেন লাগে, সেখানে জটিল নথি যেমন বই বা গবেষণাপত্রের ক্ষেত্রে প্রায় ১০০ টোকেন লাগে।
পত্রিকার জন্য বিশেষ মোড: ‘গানডাম মোড’ ও ‘টাইলিং’ কৌশল
পত্রিকার মতো ঘন বিন্যাসের নথি বিশ্লেষণের জন্য ডিপসিক ওসিআর ব্যবহার করে ‘গানডাম মোড’। এতে সর্বোচ্চ ৮০০ টোকেন ব্যবহার করে ‘টাইলিং’ কৌশলের মাধ্যমে ছবির প্রতিটি অংশ আলাদাভাবে বিশ্লেষণ করা হয়, যাতে প্রতিটি কলাম, অনুচ্ছেদ ও উপাদান সহজে শনাক্ত করা সম্ভব হয়।
মান যাচাই: অমনিডকবেঞ্চ (OmniDocBench)
ডিপসিক ওসিআর পরীক্ষিত হয়েছে অমনিডকবেঞ্চ নামের আন্তর্জাতিক মানদণ্ডে। পরীক্ষার ফল অনুযায়ী, যেখানে অন্যান্য ওসিআর সিস্টেম হাজার টোকেন ব্যবহার করেছে, সেখানে ডিপসিক ওসিআর মাত্র ১০০ টোকেন ব্যবহার করেই সফলভাবে কাজ করেছে। ইংরেজি ও চীনা ভাষায় লেখা শনাক্তের ক্ষেত্রে এর ভুলের হার উল্লেখযোগ্যভাবে কম, যা এর গতি ও নির্ভুলতার দিকটি স্পষ্ট করে।
ডিপসিক ওসিআরের প্রধান বৈশিষ্ট্য
টোকেন ব্যবহারে দক্ষতা ও ভারসাম্য।
জটিল নথির জন্য বিশেষ মোড ও বিশ্লেষণ কৌশল।
বিভিন্ন আন্তর্জাতিক ভাষায় কম ভুলের হার।
পরীক্ষিত ও স্বীকৃত কার্যকারিতা।
ডিপসিক ওসিআর শুধুমাত্র লেখা শনাক্তের একটি টুল নয়, বরং এটি নথি বিশ্লেষণে এক নতুন দিগন্ত উন্মোচন করেছে। ভবিষ্যতে এই প্রযুক্তি আরও উন্নত হয়ে বিভিন্ন ভাষা, ফন্ট ও নথির বিন্যাসে কাজ করার সক্ষমতা অর্জন করবে বলে আশা করা হচ্ছে।



