האם אתה מעוניין בהם מבצע? שמור עם הקופונים שלנו WHATSAPP o מברק!

ChatGPT הוא כעת עוזר שיכול לראות, לשמוע ולדבר

ChatGPT, שפותחה על ידי OpenAI, מציגה יכולות חדשות המאפשרות לך אינטראקציה באמצעות קול ותמונות, ומציעה ממשק אינטואיטיבי ועוד דרכים לשלב את ChatGPT בחיי היומיום שלך. בהודעה שפרסמה לאחרונה באתר האינטרנט שלה, OpenAI החליטה לחשוף את התכונות החדשות הללו מראש. כמו כן הוא גם הדגיש את היתרונות שהם מביאים ואת האתגרים שהם מציגים בשוק הבינה המלאכותית הצומח.

ChatGPT: אינטראקציה קולית

עם פונקציונליות הקול החדשה, המשתמשים יכולים לקבל שיחות אינטראקטיביות עם ChatGPT. זה מאפשר לך להשתמש באסיסט גם תוך כדי תנועה, מה שמגדיל את הפוטנציאל של הצ'אטבוט. לדוגמה, משתמש יכול לבקש מ-ChatGPT לספר סיפור ילדים תוך כדי תנועה, מה שהופך אותו למהנה יותר.

פקודות קוליות chatgpt
סיפור שנוצר על ידי הצ'אטבוט

או, במהלך ארוחת ערב עם חברים, יכול לצוץ ויכוח על נושא מסוים; במקרה זה, משתמשים יכולים להשתמש בבוט כדי להשיג מידע מדויק ולפתור את הוויכוח בצורה בונה.

טכנולוגיית הקול של ChatGPT משתמשת ב- מודל טקסט לדיבור מתקדם. בשיתוף פעולה עם שחקני קול מקצועיים, המודל הזה מסוגל לייצר אודיו דמוי אדם מטקסט ודגימות קול קצרות, מה שהופך את האינטראקציה עם ChatGPT לטבעיות ואינטואיטיביות עוד יותר. כמו כן, בזכות Whisper, מערכת זיהוי דיבור בקוד פתוח שפותחה על ידי OpenAI, מילים מדוברות הן מתומלל לטקסט בדיוק רב, המאפשר לצ'אט בוט להבין ולהגיב ביעילות לבקשות משתמשים.

ChatGPT: אינטראקציה חזותית

כאמור, דגם הבינה המלאכותית יכול כעת לנתח תמונה אחת או יותר, המאפשר למשתמשים לפתור בעיות, לתכנן ארוחות או לנתח גרפים מורכבים. לדוגמה, משתמש יכול לשלוח תמונה של תכולת המקרר שלו. לכן יש להשתמש בצ'אטבוט לנתח את המזונות הנוכחיים ולהציע מתכונים המבוססים על מרכיבים אלה, גם מתן הוראות שלב אחר שלב להכנה.

פקודות תמונה של chatgpt

קראו גם: GPT-4: תאומים תהיה היריבה של גוגל. להלן ההבדלים

יתר על כן, אם המשתמש צריך להתמקד באלמנט מסוים בתמונה, האפליקציה לנייד של ChatGPT כוללת כלי ציור מה שמאפשר לך להדגיש אזורים ספציפיים בתמונה, מה שהופך את התקשורת והניתוח למדויקים ומותאם אישית עוד יותר.

הבנת התמונה מופעלת על ידי הדגמים המולטי-מודאליים GPT-3.5 ו-GPT-4. הדגמים המתקדמים האלה הם מיישמים את כישורי השפה שלהם על מגוון רחב של תמונות, כגון תצלומים, צילומי מסך ומסמכים המכילים גם טקסט וגם תמונות, מה שמאפשר ל-ChatGPT להבין ולפרש את ההקשר החזותי בצורה מדויקת ומפורטת.

ראוי להזכיר כי מ poco OpenAI שילבה לא רק את זה קנבה אלא גם DALL-E 3 ב-ChatGPT, או מודל התמונה הגנרטיבי.

מתי ולמי זה יהיה זמין

בשבועיים הקרובים OpenAI תטמיע קול ותמונות ב-ChatGPT עבור משתמשים משתמשים עם מנויי Plus ו-Enterprise. 

הפונקציה המאפשרת אינטראקציה קולית תהיה זמינה ב-iOS וב-Android אבל לא בגרסת האינטרנט, שהיא זו שבה משתמשים רוב האנשים.

הפונקציה המאפשרת אינטראקציה חזותית תהיה זמינה במקום זאת בכל הפלטפורמות, לכן אנדרואיד, iOS ואינטרנט.

מקור | OpenAI

תגיות:

ג'יאנלוקה קובוצ'י
ג'יאנלוקה קובוצ'י

נלהב מקוד, שפות ושפות, ממשקי אדם-מכונה. כל מה שהוא אבולוציה טכנולוגית מעניין אותי. אני מנסה לחשוף את התשוקה שלי בבהירות מרבית, בהסתמך על מקורות אמינים ולא "על המעבר הראשון".

הירשם
הודע
אורח

0 תגובות
משוב משוב
הצג את כל ההערות
XiaomiToday.it
לוגו