טכנולוגיית דיבור שפותחה בעצמה של Xiaomi עוזרת לסובלים מהפרעות דיבור

טכנולוגיה טקסט לדיבור בסגנון ספונטני, שפותח על ידי מעבדת בינה מלאכותית של שיאומי בסין, זהו אחד הגבולות האחרונים בכל הנוגע לזיהוי קולי ושימוש במכשירים באמצעות קול. הפרויקט ש נולד בתוך המעבדה לוקח את השם של "הבעלים של הקול שלי". מאפשר למקבלים שלצערנו סובלים הפרעות בדיבור להיות בעל קולות ייחודיים ומותאמים אישית כדי לתקשר עם אנשים אחרים. בואו נראה בפירוט מה זה ומאז החברה הסינית עובדת על זה.

שיאומי חשפה את היישום האחרון שלה של אלגוריתמים מתקדמים וטכנולוגיית דיבור שפותחה בעצמה המסייעת לאלו עם הפרעות דיבור

Xiaomi דואגת לאנשים ושואפת לענות על הצרכים השונים שלהם באמצעות חדשנות טכנולוגית. במהלך השנים האחרונות, המותג הסיני גילה את הרצון של משתמשים רבים עם הפרעות שפה של הבעלים של הקול שלך, אפילו ייחודי, לשימוש לתקשורת יומיומית. מסיבה זו שיאומי הקימה את צוות הפרויקט "הבעלים של הקול שלי". Zhu Xi, רכז הוועדה הטכנולוגית ל-Tech for Good של Xiaomi, אמר:

אנו נרגשים לחקור את הערכים המרובים שהחדשנות הטכנולוגית מציעה לנו, כגון מענה לבקשות משתמשים לזהות אישית ובניית זהות

על מנת ליצור את הקול המתאים והמותאם ביותר עבור המשתמש עם ליקויי דיבור, צוות הפרויקט של Xiaomi גייס יותר מ-200 מתנדבים בפנים כדי לתת את הקול שלך. האלגוריתם של התאמת טביעת הקול שימש כדי להתאים את המאפיינים של הקולות שנתרמו על ידי המתנדבים לאלו של קול הנמען. דרך הגישה הזו, זה היה מצא את הקול המתאים ביותר בתור צליל התייחסות

קול בסיסי לנמען. 

xiaomi עוזרת לאנשים עם בעיות שפה

קראו גם: Mi Band 7 יוצא עם הרבה תאריך ומחיר | תמונה

מאוחר יותר, החוקרים השתמשו בטכנולוגיית סינתזת דיבור בסגנון ספונטני עבור לאמן את מודל הבינה המלאכותית. בדרך זו, קצב ואינטונציה טבעיים המסוגלים להתווסף בהדרגה לקול החדש הזה להביע את הרגש בכנות והטון של בן אדם.

Zhu Xi הוסיף:

אם נשים לב ונתייחס לצרכים של קבוצות מיעוט בשלב מוקדם, תהליך הפצת הטכנולוגיה עלול להצטמצם מאוד. זה מאפשר ליתרונות של טכנולוגיות חדשות להיות נגישים מיד למשתמשים עם צרכים מיוחדים

עמוד השדרה של הפרויקט הזה הוא קבוצה של מומחי טכנולוגיית קול מאת Xiaomi AI Lab. מאת 2017 פרסמו 37 מאמרים בעניין זה והיו נוכחים בחוגים חשובים כמו הכנס בינלאומי בנושא אקוסטיקה, דיבור ועיבוד אותות (ICASSP). ההצלחה של "הבעלים של הקול שלי"תלוי בעיקר בסגנון הספונטני של טכנולוגיית הטקסט לדיבור שהם פיתחו. הסגנון הספונטני של הטכנולוגיה טקסט לדיבור בעצם גורם לקול המסונתז להיראות כמו בן אדם אמיתי באינטונציה, בהפסקה, במהירות ובמאפיינים נוספים. זה מחליף את התחושה המונוטונית והלא טבעית של הקול האלקטרוני בתחושה טבעית יותר.

ג'יאנלוקה קובוצ'י

נלהב מהטכנולוגיה, במיוחד סמארטפונים ומחשבים אישיים. אני עושה את עבודתי בתשוקה ומכבד את עבודתם של אחרים.

הירשם
הודע
אורח
0 תגובות
משוב משוב
הצג את כל ההערות
XiaomiToday.it
לוגו