
OpenAI הכריזה על שחרור אלפא של מצב הקול המתקדם של ChatGPT, מונע ע"ידגם GPT-4o חדשני. תכונה מהפכנית זו, שמבטיחה לספק תגובות אודיו היפר-ריאליסטיות, תחילה יהיה נגיש לקבוצה קטנה של משתמשי ChatGPT Plus החל מהיום, במטרה להרחיב את הזמינות לכל מנויי הפלוס עד סתיו 2024.
מצב קולי: מצב הקול של ChatGPT הוא רשמי
הצגת מצב הקול עם GPT-4o, שהתקיימה בחודש מאי, עוררה עניין והערצה רבה בקרב הציבור, הודות מהירות דור יוצאת דופן והדמיון הבולט לקול אנושי אמיתי, שעורר השוואות לזה של השחקנית המפורסמת סקרלט ג'והנסון.
OpenAI הכחישה שהשתמשה בקולה של השחקנית, לאחר מכן הסירה את הקול מההדגמה והכריזה, ביוני, על לדחות את שחרורו של מצב קול מתקדם לשיפור אמצעי האבטחה.
בשלב אלפא זה, חלק מהתכונות המוצגות במהלך עדכון האביב, כגון שיתוף וידאו ומסך, לא ייכללו ויוצגו במועד מאוחר יותר. עם זאת, א קבוצה נבחרה של משתמשי פרימיום תהיה גישה לתכונת הקול ChatGPT המוצגת בהדגמה.
קראו גם: SearchGPT: מהו מנוע החיפוש של OpenAI וכיצד הוא פועל
מצב הקול המתקדם שונה מפתרון האודיו המוצע כיום על ידי ChatGPT, המבוסס על שלושה דגמים נפרדים. GPT-4o, בזכות שלו נטורה מולטימודלי, מסוגל לעבד משימות אלה מבלי להזדקק למודלים נלווים, וליצור תגובות קוליות עם אחד חביון מופחת משמעותית. בנוסף, OpenAI מדגיש את היכולת של GPT-4o לעשות זאת לתפוס ניואנסים רגשיים בקול, כגון עצב והתרגשות, ולזהות שירה.
כדי להבטיח ניטור קפדני של השימוש בקול של ChatGPT, OpenAI בחרה ב- שחרור הדרגתי. חברי תוכנית אלפא יקבלו התראה באפליקציית ChatGPT, ולאחריה הודעת דוא"ל המכילה הוראות לשימוש בתכונה.
היכולות הווקאליות של GPT-4o הם נבדקו ב-45 שפות, המדגים את המחויבות של OpenAI להנגיש את הטכנולוגיה הזו לקהל בינלאומי רחב. בנוסף, החברה הטמיעה מסננים חדשים עבור למנוע בקשות ליצירת מוזיקה או חומר שמע אחר המוגן בזכויות יוצרים, ובכך מגן על קניין רוחני.
מצב הקול המשופר של ChatGPT יהיה מוגבל בהתחלה ל ארבעה קולות מוגדרים מראש מאת ChatGPT: Juniper, Breeze, Cove ו- Ember, נוצרו בשיתוף פעולה עם שחקני קול מקצועיים. ל-ChatGPT לא תהיה את היכולת לחקות קולות של אנשים אחרים ותחסום כל פלט החורג מקולות ברירת המחדל הללו, ובכך יבטיח שימוש אתי ואחראי בטכנולוגיה.