পড়ার মধ্যে AI এবং অ্যাক্সেসিবিলিটির সংযোগে জো ডলসনের সাম্প্রতিক অংশসাধারণভাবে AI এর জন্য এবং অনেকে যেভাবে এটি ব্যবহার করে আসছে তার জন্য তার যে সংশয় রয়েছে তার আমি পুরোপুরি প্রশংসা করেছি। প্রকৃতপক্ষে, আমি নিজেই এআই সম্পর্কে খুব সন্দিহান, যদিও মাইক্রোসফ্টে একজন অ্যাক্সেসিবিলিটি ইনোভেশন স্ট্র্যাটেজিস্ট হিসেবে আমার ভূমিকা থাকা সত্ত্বেও যে অ্যাকসেসিবিলিটি অনুদান প্রোগ্রামের জন্য AI চালাতে সাহায্য করে। যেকোনো টুলের মতো, AI খুব গঠনমূলক, অন্তর্ভুক্তিমূলক এবং অ্যাক্সেসযোগ্য উপায়ে ব্যবহার করা যেতে পারে; এবং এটি ধ্বংসাত্মক, একচেটিয়া এবং ক্ষতিকারকগুলিতেও ব্যবহার করা যেতে পারে। এবং মাঝারি মাঝামাঝি কোথাও এক টন ব্যবহার রয়েছে।
নিবন্ধটি নীচে অব্যাহত রয়েছে
আমি চাই আপনি এটিকে “হ্যাঁ… এবং” জো’র পোস্টের পরিপূরক হিসেবে বিবেচনা করুন। আমি তিনি যা বলছেন তার কোনোটিই খণ্ডন করার চেষ্টা করছি না বরং প্রকল্প এবং সুযোগগুলির কিছু দৃশ্যমানতা প্রদান করছি যেখানে AI প্রতিবন্ধী ব্যক্তিদের জন্য অর্থপূর্ণ পার্থক্য করতে পারে। স্পষ্ট করে বলতে গেলে, আমি বলছি না যে AI এর সাথে কোনো বাস্তব ঝুঁকি বা চাপের সমস্যা নেই যা সমাধান করা দরকার—সেখানে আছে, এবং আমাদের সেগুলিকে মোকাবেলা করতে হবে, যেমন গতকাল, তবে আমি একটু নিতে চাই কি সম্ভব তা নিয়ে কথা বলার সময় এই আশায় যে আমরা একদিন সেখানে পাব।
জো’স টুকরা কম্পিউটার-ভিশন মডেলগুলির বিকল্প পাঠ্য তৈরি করার বিষয়ে কথা বলার জন্য অনেক সময় ব্যয় করে। তিনি বর্তমান অবস্থার সাথে এক টন বৈধ সমস্যা তুলে ধরেন। এবং যখন কম্পিউটার-ভিশন মডেলগুলি তাদের বর্ণনায় বিশদ গুণমান এবং সমৃদ্ধিতে উন্নতি করতে থাকে, তাদের ফলাফলগুলি দুর্দান্ত নয়। তিনি যথার্থই উল্লেখ করেছেন, চিত্র বিশ্লেষণের বর্তমান অবস্থা বেশ খারাপ – বিশেষ করে নির্দিষ্ট কিছু ছবির ধরনগুলির জন্য – বড় অংশে কারণ বর্তমান AI সিস্টেমগুলি যে প্রেক্ষাপটে রয়েছে তার চেয়ে বিচ্ছিন্নভাবে চিত্রগুলি পরীক্ষা করে (যা হওয়ার পরিণতি পাঠ্য বিশ্লেষণ এবং চিত্র বিশ্লেষণের জন্য পৃথক “ফাউন্ডেশন” মডেল)। আজকের মডেলগুলি প্রাসঙ্গিকভাবে প্রাসঙ্গিক চিত্রগুলির মধ্যে পার্থক্য করার জন্য প্রশিক্ষিত নয় (যার সম্ভবত বিবরণ থাকতে হবে) এবং যেগুলি সম্পূর্ণরূপে আলংকারিক (যার বর্ণনার প্রয়োজন নাও হতে পারে)। তবুও, আমি এখনও মনে করি এই স্থানটিতে সম্ভাবনা রয়েছে।
জো উল্লেখ করেছে, Alt টেক্সটের মানব-ইন-দ্য-লুপ অথরিং একেবারে একটি জিনিস হওয়া উচিত। এবং যদি AI অল্ট টেক্সটের জন্য একটি সূচনা বিন্দু অফার করতে পপ ইন করতে পারে-এমনকি যদি সেই প্রারম্ভিক বিন্দুটি একটি প্রম্পট বলা হতে পারে এই বিএস কি? এটা মোটেও ঠিক নয়… আমাকে একটা স্টার্টিং পয়েন্ট দেওয়ার চেষ্টা করা যাক-আমি মনে করি এটা একটা জয়।
জিনিসগুলিকে আরও এক ধাপ এগিয়ে নিয়ে, আমরা যদি প্রেক্ষাপটে চিত্রের ব্যবহার বিশ্লেষণ করার জন্য একটি মডেলকে বিশেষভাবে প্রশিক্ষণ দিতে পারি, তাহলে এটি আমাদের আরও দ্রুত সনাক্ত করতে সাহায্য করতে পারে কোন চিত্রগুলি আলংকারিক হতে পারে এবং কোনটির জন্য সম্ভবত একটি বিবরণ প্রয়োজন৷ এটি ইমেজ বর্ণনার জন্য কোন প্রসঙ্গগুলিকে কল করে তা শক্তিশালী করতে সাহায্য করবে এবং এটি তাদের পৃষ্ঠাগুলিকে আরও অ্যাক্সেসযোগ্য করার দিকে লেখকদের দক্ষতা উন্নত করবে৷
যদিও জটিল চিত্রগুলি-যেমন গ্রাফ এবং চার্ট-যেকোন ধরণের সংক্ষিপ্ত উপায়ে বর্ণনা করা চ্যালেঞ্জিং (এমনকি মানুষের জন্যও), GPT4 ঘোষণায় শেয়ার করা ছবির উদাহরণ পাশাপাশি একটি আকর্ষণীয় সুযোগ নির্দেশ করে। ধরুন আপনি এমন একটি চার্ট দেখেছেন যার বর্ণনাটি কেবল চার্টের শিরোনাম এবং এটি যে ধরণের ভিজ্যুয়ালাইজেশন ছিল, যেমন: পাই চার্ট স্মার্টফোন ব্যবহারের সাথে ফিচার ফোন ব্যবহারের সাথে তুলনা করে মার্কিন পরিবারের মধ্যে যারা বছরে $30,000 এর নিচে আয় করে। (এটি একটি চার্টের জন্য একটি চমত্কার ভয়ঙ্কর অল্ট টেক্সট হবে কারণ এটি ডেটা সম্পর্কে অনেক প্রশ্ন উত্তরহীন রেখে দেয়, কিন্তু তারপরে আবার, ধরা যাক যে সেই বর্ণনাটি ছিল।) যদি আপনার ব্রাউজার জানত যে সেই চিত্রটি ছিল একটি পাই চার্ট (কারণ একটি অনবোর্ড মডেল এটি উপসংহারে এসেছে), এমন একটি বিশ্বের কল্পনা করুন যেখানে ব্যবহারকারীরা গ্রাফিক সম্পর্কে এই ধরনের প্রশ্ন জিজ্ঞাসা করতে পারে:
- বেশি মানুষ কি স্মার্টফোন বা ফিচার ফোন ব্যবহার করেন?
- আর কত?
- এমন একদল লোক আছে যারা এই বালতিগুলির মধ্যে পড়ে না?
- এটা কয়টি?
বাস্তবতা একপাশে স্থাপন বড় ভাষা মডেল (LLM) হ্যালুসিনেশন—যেখানে একটি মডেল শুধুমাত্র যুক্তিযুক্ত শব্দযুক্ত “তথ্য” তৈরি করে—এক মুহুর্তের জন্য, এইভাবে চিত্র এবং ডেটা সম্পর্কে আরও জানার সুযোগ অন্ধ এবং স্বল্পদৃষ্টিসম্পন্ন ব্যক্তিদের পাশাপাশি বিভিন্ন ধরণের রঙের লোকেদের জন্য বিপ্লবী হতে পারে অন্ধত্ব, জ্ঞানীয় অক্ষমতা, এবং তাই। এটি শিক্ষাগত প্রেক্ষাপটে লোকেদের সাহায্য করার জন্যও উপযোগী হতে পারে পারে চার্টের ডেটা বোঝার জন্য এই চার্টগুলি দেখুন।
জিনিসগুলিকে আরও এক ধাপ এগিয়ে নিয়ে যাওয়া: আপনি যদি আপনার ব্রাউজারকে একটি জটিল চার্ট সরল করতে বলতে পারেন তবে কী হবে? যদি আপনি একটি লাইন গ্রাফে একটি একক লাইন বিচ্ছিন্ন করতে বলতে পারেন? আপনি যদি আপনার ব্রাউজারকে বিভিন্ন লাইনের রঙগুলিকে আপনার বর্ণান্ধতার জন্য আরও ভালভাবে কাজ করতে বলতে পারেন তবে কী হবে? আপনি যদি প্যাটার্নের জন্য রং অদলবদল করতে বলতে পারেন? এই সরঞ্জামগুলির চ্যাট-ভিত্তিক ইন্টারফেস এবং আজকের এআই সরঞ্জামগুলিতে চিত্রগুলি পরিচালনা করার আমাদের বিদ্যমান ক্ষমতা দেওয়া, এটি একটি সম্ভাবনা বলে মনে হচ্ছে।
এখন একটি উদ্দেশ্য-নির্মিত মডেল কল্পনা করুন যা সেই চার্ট থেকে তথ্য বের করে অন্য ফর্ম্যাটে রূপান্তর করতে পারে। উদাহরণস্বরূপ, সম্ভবত এটি সেই পাই চার্টকে (বা আরও ভাল, পাই চার্টের একটি সিরিজ) আরও অ্যাক্সেসযোগ্য (এবং দরকারী) ফর্ম্যাটে পরিণত করতে পারে, যেমন স্প্রেডশীট। যে আশ্চর্যজনক হবে!
ম্যাচিং অ্যালগরিদম#বিভাগ 3
সাফিয়া উমোজা নোবেল তার বইয়ের শিরোনাম করার সময় একেবারে মাথায় পেরেক মারেন নিপীড়নের অ্যালগরিদম. যদিও তার বইটি অনুসন্ধান ইঞ্জিনগুলি বর্ণবাদকে শক্তিশালী করার উপায়গুলির উপর দৃষ্টি নিবদ্ধ করেছিল, আমি মনে করি যে এটি সমানভাবে সত্য যে সমস্ত কম্পিউটার মডেলের মধ্যে দ্বন্দ্ব, পক্ষপাত এবং অসহিষ্ণুতা বৃদ্ধি করার সম্ভাবনা রয়েছে৷ টুইটার সর্বদা আপনাকে একজন উদাস ধনকুবেরের সাম্প্রতিক টুইট দেখায়, YouTube আমাদের একটি Q-গহ্বরে পাঠায়, বা ইনস্টাগ্রাম প্রাকৃতিক দেহগুলি কেমন দেখায় সে সম্পর্কে আমাদের ধারণাগুলিকে বিকৃত করে, আমরা জানি যে খারাপভাবে লেখা এবং রক্ষণাবেক্ষণ করা অ্যালগরিদমগুলি অবিশ্বাস্যভাবে ক্ষতিকারক। যারা তাদের গঠন ও নির্মাণ করে তাদের মধ্যে বৈচিত্র্যের অভাব থেকে এর অনেকটাই উদ্ভূত হয়। এই প্ল্যাটফর্মগুলি যখন ইনক্লুসিভলি বেকড ইন দিয়ে তৈরি করা হয়, তবে, প্রতিবন্ধী ব্যক্তিদের সাহায্য করার জন্য অ্যালগরিদম বিকাশের বাস্তব সম্ভাবনা রয়েছে।
নিন উদ্যোগউদাহরণস্বরূপ তারা নিউরোডাইভারজেন্ট লোকেদের জন্য একটি কর্মসংস্থান নেটওয়ার্ক। তারা 75 টিরও বেশি ডেটা পয়েন্টের উপর ভিত্তি করে সম্ভাব্য নিয়োগকারীদের সাথে চাকরি প্রার্থীদের মেলাতে একটি অ্যালগরিদম ব্যবহার করে। চাকরি-প্রার্থীর দিক থেকে, এটি প্রতিটি প্রার্থীর শক্তি, তাদের প্রয়োজনীয় এবং পছন্দের কর্মক্ষেত্রে থাকার ব্যবস্থা, পরিবেশগত সংবেদনশীলতা ইত্যাদি বিবেচনা করে। নিয়োগকর্তার পক্ষে, এটি প্রতিটি কাজের পরিবেশ, প্রতিটি কাজের সাথে সম্পর্কিত যোগাযোগের কারণগুলি এবং এর মতো বিবেচনা করে। নিউরোডাইভারজেন্ট লোকদের দ্বারা চালিত একটি সংস্থা হিসাবে, মেন্ট্রা সাধারণ কর্মসংস্থানের সাইটগুলির ক্ষেত্রে স্ক্রিপ্টটি উল্টানোর সিদ্ধান্ত নিয়েছিল। তারা তাদের অ্যালগরিদম ব্যবহার করে কোম্পানীর কাছে উপলব্ধ প্রার্থীদের প্রস্তাব দেয়, যারা তখন তাদের আগ্রহী চাকরী প্রার্থীদের সাথে যোগাযোগ করতে পারে; কাজ-প্রার্থীদের দিকে মানসিক এবং শারীরিক শ্রম হ্রাস করা।
যখন আরও বেশি প্রতিবন্ধী ব্যক্তি অ্যালগরিদম তৈরিতে জড়িত থাকে, তখন এই অ্যালগরিদমগুলি তাদের সম্প্রদায়ের ক্ষতি করার সম্ভাবনা কমিয়ে দিতে পারে। তাই বৈচিত্র্যময় দলগুলো এত গুরুত্বপূর্ণ।
কল্পনা করুন যে আপনি কাকে অনুসরণ করছেন তা বিশ্লেষণ করার জন্য একটি সোশ্যাল মিডিয়া কোম্পানির সুপারিশ ইঞ্জিন টিউন করা হয়েছে এবং যদি এটি এমন লোকেদের জন্য সুপারিশ অনুসরণ করার অগ্রাধিকার দেওয়ার জন্য টিউন করা হয়েছে যারা একই ধরনের বিষয়ে কথা বলেছেন কিন্তু যারা আপনার বিদ্যমান প্রভাবের ক্ষেত্র থেকে কিছু মূল উপায়ে ভিন্ন ছিল। উদাহরণস্বরূপ, আপনি যদি অক্ষম শ্বেতাঙ্গ পুরুষ শিক্ষাবিদদের একটি গুচ্ছ অনুসরণ করেন যারা AI সম্পর্কে কথা বলেন, তাহলে এটি আপনাকে পরামর্শ দিতে পারে যে আপনি শিক্ষাবিদদের অনুসরণ করেন যারা অক্ষম বা সাদা নন বা পুরুষ নন যারা এআই সম্পর্কে কথা বলেন। আপনি যদি এটির সুপারিশগুলি গ্রহণ করেন, তাহলে সম্ভবত আপনি AI ক্ষেত্রে কী ঘটছে তার আরও সামগ্রিক এবং সংক্ষিপ্ত উপলব্ধি পাবেন। এই একই সিস্টেমগুলিকে নির্দিষ্ট সম্প্রদায়গুলির সম্পর্কে পক্ষপাত সম্পর্কে তাদের বোঝাপড়া ব্যবহার করা উচিত – যেমন, প্রতিবন্ধী সম্প্রদায় সহ – এটি নিশ্চিত করার জন্য যে তারা তাদের ব্যবহারকারীদের এমন কোনও অ্যাকাউন্ট অনুসরণ করার পরামর্শ দিচ্ছে না যা তাদের বিরুদ্ধে পক্ষপাতিত্ব বজায় রাখে (বা আরও খারাপ, ঘৃণা ছড়ায়) ) ঐ দলগুলো।
অন্যান্য উপায় যা AI প্রতিবন্ধী ব্যক্তিদের সাহায্য করতে পারে#বিভাগ ৪
যদি আমি এটিকে অন্য কাজের মধ্যে একত্রিত করার চেষ্টা না করতাম, আমি নিশ্চিত যে আমি প্রতিবন্ধী ব্যক্তিদের সাহায্য করার জন্য কীভাবে AI ব্যবহার করা যেতে পারে তার সব ধরনের উদাহরণ প্রদান করে আমি চালিয়ে যেতে পারতাম, কিন্তু আমি করতে যাচ্ছি একটি বাজ বৃত্তাকার একটি বিট মধ্যে এই শেষ অধ্যায়. কোন বিশেষ ক্রমে:
- ভয়েস সংরক্ষণ। আপনি হয়তো দেখেছেন VALL-E কাগজ বা অ্যাপলের গ্লোবাল অ্যাক্সেসিবিলিটি সচেতনতা দিবসের ঘোষণা অথবা আপনি ভয়েস-সংরক্ষণের অফারগুলির সাথে পরিচিত হতে পারেন মাইক্রোসফট, অ্যাকাপেলাবা অন্যদের আপনার ভয়েসের প্রতিলিপি করার জন্য একটি AI মডেলকে প্রশিক্ষণ দেওয়া সম্ভব, যা ALS (Lou Gehrig’s disease) বা মোটর-নিউরন রোগ বা অন্যান্য চিকিৎসাগত অবস্থা যা কথা বলার অক্ষমতার কারণ হতে পারে তাদের জন্য একটি অসাধারণ বর হতে পারে। এটি অবশ্যই একই প্রযুক্তি যা অডিও ডিপফেক তৈরি করতেও ব্যবহার করা যেতে পারে, তাই এটি এমন কিছু যা আমাদের কাছে যেতে হবে দায়িত্বশীলভাবেকিন্তু প্রযুক্তির সত্যিই রূপান্তরকারী সম্ভাবনা রয়েছে।
- ভয়েস স্বীকৃতি। গবেষকদের মত যারা বক্তৃতা অ্যাক্সেসিবিলিটি প্রকল্প অস্বাভাবিক বক্তৃতা সহ লোকেদের রেকর্ডিং সংগ্রহে তাদের সহায়তার জন্য প্রতিবন্ধী ব্যক্তিদের অর্থ প্রদান করছে। আমি টাইপ করার সাথে সাথে, তারা সক্রিয়ভাবে পারকিনসন্স এবং এর সাথে সম্পর্কিত অবস্থার লোকেদের নিয়োগ করছে এবং প্রকল্পের অগ্রগতির সাথে সাথে এটিকে অন্যান্য শর্তে প্রসারিত করার তাদের পরিকল্পনা রয়েছে। এই গবেষণার ফলে আরও অন্তর্ভুক্ত ডেটা সেট তৈরি হবে যা আরও বেশি প্রতিবন্ধী ব্যক্তিদের ভয়েস অ্যাসিস্ট্যান্ট, ডিকটেশন সফ্টওয়্যার এবং ভয়েস-প্রতিক্রিয়া পরিষেবাগুলি ব্যবহার করার পাশাপাশি শুধুমাত্র তাদের ভয়েস ব্যবহার করে তাদের কম্পিউটার এবং অন্যান্য ডিভাইসগুলিকে আরও সহজে নিয়ন্ত্রণ করতে দেবে।
- পাঠ্য রূপান্তর। LLM-এর বর্তমান প্রজন্ম হ্যালুসিনেশন না করেই বিদ্যমান পাঠ্য বিষয়বস্তু সামঞ্জস্য করতে যথেষ্ট সক্ষম। এটি জ্ঞানীয় প্রতিবন্ধী ব্যক্তিদের জন্য ব্যাপকভাবে ক্ষমতায়ন করে যারা পাঠ্যের সারাংশ বা পাঠ্যের সরলীকৃত সংস্করণ থেকে উপকৃত হতে পারে বা এমনকি পাঠ্যের জন্য প্রস্তুত করা হয়েছে বায়োনিক রিডিং.
বিভিন্ন দল এবং ডেটার গুরুত্ব#বিভাগ 5
আমাদের বুঝতে হবে যে আমাদের পার্থক্য গুরুত্বপূর্ণ। আমাদের জীবিত অভিজ্ঞতাগুলি আমাদের বিদ্যমান পরিচয়গুলির ছেদগুলির দ্বারা প্রভাবিত হয়৷ এই জীবিত অভিজ্ঞতাগুলি – তাদের সমস্ত জটিলতা (এবং আনন্দ এবং বেদনা) সহ – আমরা যে সফ্টওয়্যার, পরিষেবা এবং সমাজগুলি গঠন করি তার জন্য মূল্যবান ইনপুট৷ আমাদের পার্থক্যগুলিকে উপস্থাপিত করা দরকার ডেটাতে যা আমরা নতুন মডেলগুলিকে প্রশিক্ষিত করতে ব্যবহার করি, এবং যারা এই মূল্যবান তথ্যটি অবদান রাখে তাদের আমাদের সাথে শেয়ার করার জন্য ক্ষতিপূরণ দিতে হবে। অন্তর্ভুক্তিমূলক ডেটা সেটগুলি আরও শক্তিশালী মডেল তৈরি করে যা আরও ন্যায়সঙ্গত ফলাফলকে উত্সাহিত করে।
এমন একটি মডেল চান যা প্রতিবন্ধী ব্যক্তিদের অবজ্ঞা বা পৃষ্ঠপোষকতা বা উদ্দেশ্যমূলক না করে? নিশ্চিত করুন যে আপনার কাছে অক্ষমতা সম্পর্কিত বিষয়বস্তু রয়েছে যা বিভিন্ন প্রতিবন্ধী ব্যক্তিদের দ্বারা রচিত, এবং নিশ্চিত করুন যে এটি প্রশিক্ষণের ডেটাতে ভালভাবে উপস্থাপন করা হয়েছে।
এমন একটি মডেল চান যা সক্ষম ভাষা ব্যবহার করে না? আপনি ব্যবহার করতে সক্ষম হতে পারে বিদ্যমান ডেটা সেট একটি ফিল্টার তৈরি করা যা পাঠকদের কাছে পৌঁছানোর আগেই সক্ষম ভাষাকে বাধা দিতে পারে এবং প্রতিকার করতে পারে। বলা হচ্ছে, সংবেদনশীলতা পড়ার ক্ষেত্রে, এআই মডেলগুলি শীঘ্রই যে কোনও সময় মানব কপি সম্পাদকদের প্রতিস্থাপন করবে না।
একটি কোডিং সহপাইলট চান যা আপনাকে জাম্প থেকে অ্যাক্সেসযোগ্য সুপারিশ দেয়? আপনি অ্যাক্সেসযোগ্য হতে জানেন যে কোড এটি প্রশিক্ষণ.
আমার কোন সন্দেহ নেই যে AI মানুষের ক্ষতি করতে পারে এবং করবে… আজ, আগামীকাল এবং ভবিষ্যতেও। কিন্তু আমি এটাও বিশ্বাস করি যে আমরা এটা স্বীকার করতে পারি এবং অ্যাক্সেসিবিলিটির দিকে নজর রেখে (এবং, আরও বিস্তৃতভাবে, অন্তর্ভুক্তি), AI এর প্রতি আমাদের দৃষ্টিভঙ্গিতে চিন্তাশীল, বিবেচ্য এবং ইচ্ছাকৃত পরিবর্তন করতে পারি যা সময়ের সাথে সাথে ক্ষতিও কমিয়ে দেবে। আজ, আগামীকাল, এবং ভবিষ্যতে ভাল।
এই অংশটির উন্নয়নে আমাকে সাহায্য করার জন্য কার্তিক সাহনিকে অনেক ধন্যবাদ, অ্যাশলে বিশফকে তার অমূল্য সম্পাদকীয় সহায়তার জন্য, এবং অবশ্যই, প্রম্পটের জন্য জো ডলসনকে।