প্যানাসনিক দুটি উন্নত এআই প্রযুক্তি উদ্ভাবন করেছে,
CVPR2021 এ গৃহীত,
বিশ্বের শীর্ষস্থানীয় আন্তর্জাতিক এআই প্রযুক্তি সম্মেলন
[১] হোম অ্যাকশন জিনোম: কনট্রাস্টিভ কম্পোজিশনাল অ্যাকশন বোঝার
আমরা ঘোষণা করতে পেরে আনন্দিত যে আমরা একটি নতুন ডেটাসেট "হোম অ্যাকশন জিনোম" তৈরি করেছি যা ক্যামেরা, মাইক্রোফোন এবং থার্মাল সেন্সর সহ বিভিন্ন ধরণের সেন্সর ব্যবহার করে তাদের বাড়িতে মানুষের দৈনন্দিন কার্যকলাপ সংগ্রহ করে। আমরা লিভিং স্পেসের জন্য বিশ্বের বৃহত্তম মাল্টিমডাল ডেটাসেট তৈরি এবং প্রকাশ করেছি, যখন লিভিং স্পেসের জন্য বেশিরভাগ ডেটাসেট স্কেলে ছোট। এই ডেটাসেটটি প্রয়োগ করে, এআই গবেষকরা এটিকে মেশিন লার্নিং এবং এআই গবেষণার জন্য প্রশিক্ষণ ডেটা হিসাবে ব্যবহার করতে পারেন যাতে লোকেদের বসবাসের জায়গায় সহায়তা করা যায়।
উপরোক্ত ছাড়াও, আমরা মাল্টিমোডাল এবং একাধিক দৃষ্টিভঙ্গিতে শ্রেণিবদ্ধ কার্যকলাপ স্বীকৃতির জন্য একটি সমবায় শিক্ষার প্রযুক্তি তৈরি করেছি। এই প্রযুক্তি প্রয়োগ করে, আমরা বিভিন্ন দৃষ্টিভঙ্গি, সেন্সর, অনুক্রমিক আচরণ এবং বিশদ আচরণ লেবেলের মধ্যে সামঞ্জস্যপূর্ণ বৈশিষ্ট্যগুলি শিখতে পারি এবং এইভাবে জীবন্ত স্থানগুলিতে জটিল কার্যকলাপের স্বীকৃতি কার্যকারিতা উন্নত করতে পারি।
এই প্রযুক্তিটি ডিজিটাল এআই প্রযুক্তি কেন্দ্র, প্রযুক্তি বিভাগ এবং স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের স্ট্যানফোর্ড ভিশন এবং লার্নিং ল্যাবের মধ্যে সহযোগিতায় পরিচালিত গবেষণার ফলাফল।
চিত্র 1: কোঅপারেটিভ কম্পোজিশনাল অ্যাকশন আন্ডারস্ট্যান্ডিং (CCAU) সমবায়ভাবে সমস্ত পদ্ধতিকে একসাথে প্রশিক্ষণ দেয় যা আমাদের উন্নত কর্মক্ষমতা দেখতে দেয়।
আমরা ভিডিও-স্তর এবং পারমাণবিক ক্রিয়া উভয় লেবেল ব্যবহার করে প্রশিক্ষণ ব্যবহার করি যাতে ভিডিও এবং পারমাণবিক ক্রিয়া উভয়ের মধ্যে গঠনমূলক মিথস্ক্রিয়া থেকে উপকৃত হতে পারে।
[২] অটোডো: স্কেলযোগ্য সম্ভাব্য অন্তর্নিহিত পার্থক্যের মাধ্যমে লেবেল নয়েজ সহ পক্ষপাতদুষ্ট ডেটার জন্য শক্তিশালী অটোঅগমেন্ট
আমরা ঘোষণা করতে পেরে আনন্দিত যে আমরা একটি নতুন মেশিন লার্নিং প্রযুক্তি তৈরি করেছি যা স্বয়ংক্রিয়ভাবে প্রশিক্ষণের ডেটা বিতরণ অনুযায়ী সর্বোত্তম ডেটা বৃদ্ধি করে। এই প্রযুক্তি বাস্তব বিশ্বের পরিস্থিতিতে প্রয়োগ করা যেতে পারে, যেখানে উপলভ্য ডেটা খুব কম। আমাদের প্রধান ব্যবসায়িক ক্ষেত্রগুলিতে এমন অনেক ক্ষেত্রে রয়েছে, যেখানে উপলব্ধ ডেটার সীমাবদ্ধতার কারণে AI প্রযুক্তি প্রয়োগ করা কঠিন। এই প্রযুক্তি প্রয়োগ করে, ডেটা বৃদ্ধির পরামিতিগুলির টিউনিং প্রক্রিয়াটি বাদ দেওয়া যেতে পারে এবং পরামিতিগুলি স্বয়ংক্রিয়ভাবে সামঞ্জস্য করা যেতে পারে। অতএব, আশা করা যায় যে AI প্রযুক্তির প্রয়োগের পরিসর আরও ব্যাপকভাবে ছড়িয়ে দেওয়া যেতে পারে। ভবিষ্যতে, এই প্রযুক্তির গবেষণা এবং বিকাশকে আরও ত্বরান্বিত করে, আমরা AI প্রযুক্তি উপলব্ধি করার জন্য কাজ করব যা বাস্তব-বিশ্বের পরিবেশ যেমন পরিচিত ডিভাইস এবং সিস্টেমে ব্যবহার করা যেতে পারে। এই প্রযুক্তিটি আমেরিকার প্যানাসনিক আরএন্ডডি কোম্পানির ডিজিটাল এআই প্রযুক্তি কেন্দ্র, প্রযুক্তি বিভাগ, এআই ল্যাবরেটরি দ্বারা পরিচালিত গবেষণার ফলাফল।
চিত্র 2: অটোডিও ডেটা অগমেন্টেশনের সমস্যা সমাধান করে (শেয়ারড-পলিসি DA দ্বিধা)। বর্ধিত ট্রেন ডেটার বিতরণ (ড্যাশ করা নীল) সুপ্ত স্থানে পরীক্ষার ডেটা (সলিড লাল) এর সাথে মেলে না:
"2" আন্ডার-অগমেন্টেড, যখন "5" ওভারঅগমেন্টেড। ফলস্বরূপ, পূর্বের পদ্ধতিগুলি পরীক্ষার বিতরণের সাথে মেলে না এবং শেখা শ্রেণীবিভাগকারী f(θ) এর সিদ্ধান্তটি ভুল।
এই প্রযুক্তিগুলির বিশদ বিবরণ CVPR2021 এ উপস্থাপন করা হবে (19শে জুন, 2017 থেকে অনুষ্ঠিত হবে)।
উপরের বার্তাটি প্যানাসনিকের অফিসিয়াল ওয়েবসাইট থেকে এসেছে!
পোস্টের সময়: জুন-০৩-২০২১