کتاب های صوتی هوش مصنوعی اپل (Apple’s AI audiobooks) هنوز نمی توانند جایگاه راویان انسانی را از بگیرند
اگر از طرفداران کتاب های صوتی هستید، اپل به تازگی با عرضه اولین دسته از کتاب های روایت شده با هوش مصنوعی، تصویر آینده ای پیشرفته تر را برای شما ترسیم کرده است. اما در حالی که این حرکت یک عمل جذاب با پیامدهای بزرگ است، لحن رباتیک گونه راویان نشان می دهد که صدای انسان ها هنوز بسیار دوست داشتنی ست و فعلا اشخاص راوی جایگاه بهتری نسبت به راویان هوش مصنوعی و ربات ها دارند.
شما با جستجوی کلمه «AI narration» می توانید کتاب های صوتی با صدای هوش مصنوعی را که از ویژگی ترجمه و تبدیل متن به گفتار استفاده می کنند، در اپلیکیشن Apple Books بیابید. این جست و جو فهرستی از کتابهای عاشقانه یا داستانی (هم رایگان و هم پولی) را نشان می دهد که با توضیح «به روایت اپل بوکز» (narrated by Apple Books) آمده است.
Apple Books دو نوع صدای هوش مصنوعی را ارائه می دهد: یک سوپرانو به نام مدیسون و دیگری صدای بین بم و زیر به نام جکسون که هر دو لهجه آمریکایی دارند و فعلا فقط به زبان انگلیسی صحبت می کنند. شما می توانید با ضربه زدن روی دکمه «پیش نمایش» در زیر یکی از عناوین روایت شده توسط Apple Books، این صداها را بشنوید و انتخاب کنید.
در حال حاضر مسلما فقط کیفیت رباتیک و مصنوعی در هر دو صدای هوش مصنوعی اپل وجود دارد و به این زودی ها از لحن های گرم و رسا راویان محبوبی مانند استفن فرای یا جولیا ویلان در این برنامه خبری نخواهد بود. اما در حالی که این موضوع همچون مانعی سخت برای عبور راویان هوش مصنوعی است، ولی قطعا سریع تر به گوش ما می رسند چرا که دسترسی به آن ها بسیار راحت است. اپل می گوید صدای هوش مصنوعی آن به گونه ای توسعه یافته است که کتاب های صوتی را «در دسترس همه» قرار دهد. اما این ویژگی همچنین صنعت چند میلیارد دلاری کتاب های صوتی را برای غول فناوری قابل دسترس تر می کند. البته ویژگی جدید Apple Books شروع نبردی سخت با شرکت هایی مانند آمازون و Spotify برای گوش های علاقمند ما به کتاب های صوتی نیز می باشد!
ابراز نگرانی
در حال حاضر، اکثراً شاهد خواهیم بود که راوی های هوش مصنوعی محدود به کتاب های ناشران مستقل کوچک تر هستند. این موضوع می تواند جرقه انفجاری در تعداد کتاب های صوتی در دسترس خوانندگان در همه دستگاه ها باشد، زیرا روایت دیجیتال بازار جدیدی را به روی ناشران و نویسندگانی می گشاید که قبلاً قادر به پرداخت هزینه های چاپی به صوتی نبودند.
اما واکنش ناشران بزرگ تر و صداپیشگان نیز می تواند ظهور راوی های رباتیک را کمتر کند. برای نمونه کتابخوان های الکترونیکی Kindle آمازون چندین سال پیش به طور رسمی قدرت تبدیل متن به گفتار خود را از دست دادند، حتی اگر راه حل هایی در منوهای دسترسی وجود داشته باشد. این تصمیم حداقل تا حدی به دلیل مسائل مربوط به حق چاپ و کتاب های صوتی بود که از نظر قانونی به عنوان آثار هنری متمایز در نظر گرفته می شدند.
همچنین Audible متعلق به آمازون به طور مفصل در مورد اینکه کدام راویان مناسب انواع مختلف کتاب هستند و چگونه ناشران کتاب مناسب را انتخاب می کنند، نوشته است. وبلاگ این مجموعه می گوید که “مهم ترین جنبه در مورد کتاب های صوتی این است که صدا با لحن و ژانر کتاب مطابقت داشته باشد”. اگر مانند Apple Books فقط دو صدا داشته باشید، دستیابی به این امر تا حدودی دشوار است.
Audible در ادامه میگوید که «صداپیشگان باتجربه می توانند با بازی با تن زیر و بم، لحن، صدا و لهجه ها به راحتی بین ویژگی های آوازی تمایز قائل شوند» و مطمئناً اینجا جایی است که صداپیشه های هوش مصنوعی باید تمرینات صوتی شدیدی انجام دهند و شاید در کلاس های شبیه سازی احساسی نیز شرکت کنند!
اما ویژگی جدید Apple Books به وضوح شروع یک رونق اجتناب ناپذیر در فناوری صدای هوش مصنوعی است و لحظه واقعاً بزرگ برای کتاب های صوتی ممکن است زمانی باشد که هوش مصنوعی می تواند به جای خواندن رباتیک یک فیلمنامه، به طور متقاعدکننده ای شبیه یک صداپیشه معروف باشد. جالب است بدانید که با توجه به اطلاعات به دست آمده از آمازون این ویژگی چندان دور از دسترس و ناممکن نخواهد بود.
امپراتوری جعلی
به هر حال، دیپ فیک ها (deepfakes: جعل صدا و تصویر شخص با استفاده از هوش مصنوعی و ایجاد فیلم به ظاهر واقعی وی) فقط به ویدیوهای ترسناک متقاعدکننده مورگان فریمن یا تام کروز مصنوعی محدود نمی شوند؛ فناوری صوتی مبتنی بر هوش مصنوعی نیز به سرعت در حال توسعه است. برای نمونه اپلیکیشن های تحت وب فراگیر مانند Uberduck به شما این امکان را می دهند که با صدای روسای جمهور مختلف یا شخصیت های کارتونی صحبت کنید، همچنین سال گذشته آمازون یک مهارت جدید و کمی ترسناک الکسا را به نمایش گذاشت که می توانست کاراکتر جادوگر شهر اوز را برای یک کودک با صدای مادربزرگش بخواند!
البته با پیشبرد فناوری هایی مانند Google Wavenet، صداهای هوش مصنوعی قانع کننده تر می شوند. در حال حاضر، موانع بر سر پذیرش گسترده کتاب های صوتی احتمالاً بیشتر قانونی و اخلاقی خواهد بود تا مرتبط با فناوری. اما راوی های هوش مصنوعی Apple Books صدای آینده ما هستند و در آیندهای نه چندان دور، راوی های معروف صدا احتمالاً کپی رایت و مجوز صدای خود را نیز خواهند داشت.
در حال حاضر، شواهد موجود در کتاب های اپل نشان می دهد که این صداهای هوش مصنوعی در حال حاضر به جای داستان سرایی احساسی، برای آثار غیرداستانی و واقعی مناسب هستند. اما بدون توجه به این موضوع، قطعا سیلی عظیم از کتاب های صوتی هوش مصنوعی با موضوعات مختلف در راه است.