এখন খুব সহজেই মানুষ ও রোবটের কণ্ঠস্বরের পার্থক্য ধরা যায়। কিন্তু একটা
সময় আসবে, যখন রোবটের কণ্ঠস্বর মানুষকে বোকা বানাতে সক্ষম হবে। রোবটের
কণ্ঠস্বর হুবহু মানুষের মতো হয়ে যাবে। মানুষ ধরতে পারবে না সে রোবট, নাকি
মানুষের সঙ্গে কথা বলছে। গুগলের ডিপমাইন্ড নামের কৃত্রিম বুদ্ধিমত্তা
সফটওয়্যার নির্মাতা দলের গবেষকেরা ‘ওয়েভনেট’ নামের এই কৃত্রিম বুদ্ধিমান
সফটওয়্যার তৈরি করেছেন।
গুগলের ডিপমাইন্ড টিম বুদ্ধিমান কম্পিউটার তৈরিতে কাজ করছে। এরই প্রক্রিয়ার অংশ হিসেবে তাঁরা যন্ত্র থেকে উৎপন্ন শব্দ মানুষের মতো করার জন্য কাজ করছেন। তাঁদের তৈরি এই সিস্টেমে বর্তমানে থাকা টেক্সট টু স্পিচ প্রযুক্তি ৫০ শতাংশ বেশি উন্নত হবে।
২০১৪ সালে যুক্তরাজ্যভিত্তিক ডিপমাইন্ডকে ৫৩ কোটি ৩০ লাখ মার্কিন ডলারে কিনে নেয় গুগল।
বর্তমানে অনেক কম্পিউটার উৎপন্ন শব্দের ক্ষেত্রে যেকোনো একটি বক্তার আওয়াজে ছোট ছোট রেকর্ডিংয়ের বিশাল ডেটাসেট নিয়ে কাজ করে। এসব শব্দ একসঙ্গে যুক্ত হয়ে নতুন শব্দ তৈরি করে। এতে শব্দ সহজে পরিবর্তন করা যায় না। অন্যান্য ক্ষেত্রে ইলেকট্রনিক উপায়ে শব্দ তৈরি করা হয়। এতে শব্দের উচ্চারণ রোবটিক শোনায়।
ডিপমাইন্ড টিমের ভাষ্য, ওয়েভনেট হবে একধরনের কৃত্রিম বুদ্ধিমত্তা, যাকে নিউরাল নেটওয়ার্ক বলা যায়। এতে মানুষের মস্তিষ্কের স্নায়ুকোষ (নিউরন) যেভাবে কাজ করে, সেভাবে কাজ করবে। স্নায়ুতন্ত্রের গঠনমূলক ও কার্যকরী একককে নিউরন বলে। মস্তিষ্ক কোটি কোটি নিউরন দিয়ে তৈরি। গবেষকেরা বলছেন, নিউরন নেটওয়ার্ককে বিশাল ডেটাসেট দিয়ে প্রশিক্ষণ দিতে হয়।
গবেষকেরা বলছেন, প্রযুক্তিগত উন্নয়ন হলেও এখনই এটি অ্যাপ্লিকেশন আকারে বাজারে ছাড়া হচ্ছে না। কারণ, পুরো সিস্টেমের জন্য কম ক্ষমতাশালী প্রসেসিং ক্ষমতার কম্পিউটার দরকার হবে।
তথ্যসূত্র: ব্লুমবার্গ
গুগলের ডিপমাইন্ড টিম বুদ্ধিমান কম্পিউটার তৈরিতে কাজ করছে। এরই প্রক্রিয়ার অংশ হিসেবে তাঁরা যন্ত্র থেকে উৎপন্ন শব্দ মানুষের মতো করার জন্য কাজ করছেন। তাঁদের তৈরি এই সিস্টেমে বর্তমানে থাকা টেক্সট টু স্পিচ প্রযুক্তি ৫০ শতাংশ বেশি উন্নত হবে।
২০১৪ সালে যুক্তরাজ্যভিত্তিক ডিপমাইন্ডকে ৫৩ কোটি ৩০ লাখ মার্কিন ডলারে কিনে নেয় গুগল।
বর্তমানে অনেক কম্পিউটার উৎপন্ন শব্দের ক্ষেত্রে যেকোনো একটি বক্তার আওয়াজে ছোট ছোট রেকর্ডিংয়ের বিশাল ডেটাসেট নিয়ে কাজ করে। এসব শব্দ একসঙ্গে যুক্ত হয়ে নতুন শব্দ তৈরি করে। এতে শব্দ সহজে পরিবর্তন করা যায় না। অন্যান্য ক্ষেত্রে ইলেকট্রনিক উপায়ে শব্দ তৈরি করা হয়। এতে শব্দের উচ্চারণ রোবটিক শোনায়।
ডিপমাইন্ড টিমের ভাষ্য, ওয়েভনেট হবে একধরনের কৃত্রিম বুদ্ধিমত্তা, যাকে নিউরাল নেটওয়ার্ক বলা যায়। এতে মানুষের মস্তিষ্কের স্নায়ুকোষ (নিউরন) যেভাবে কাজ করে, সেভাবে কাজ করবে। স্নায়ুতন্ত্রের গঠনমূলক ও কার্যকরী একককে নিউরন বলে। মস্তিষ্ক কোটি কোটি নিউরন দিয়ে তৈরি। গবেষকেরা বলছেন, নিউরন নেটওয়ার্ককে বিশাল ডেটাসেট দিয়ে প্রশিক্ষণ দিতে হয়।
গবেষকেরা বলছেন, প্রযুক্তিগত উন্নয়ন হলেও এখনই এটি অ্যাপ্লিকেশন আকারে বাজারে ছাড়া হচ্ছে না। কারণ, পুরো সিস্টেমের জন্য কম ক্ষমতাশালী প্রসেসিং ক্ষমতার কম্পিউটার দরকার হবে।
তথ্যসূত্র: ব্লুমবার্গ