Sztuczna inteligencja przywraca głos i tożsamość Fran Vivó, pacjentce z SLA

  • Naukowcy z VertexLit (ValgraI i VRAIN, UPV) zrekonstruowali głos pacjenta chorego na SLA, wykorzystując zaledwie 20 minut nagrania audio.
  • Model neuronowy zachowuje barwę, prozodię i lokalny akcent w języku hiszpańskim i walenckim, aby uniknąć głosu robota.
  • Rodzina dostosowuje emocje i intonację za pomocą edytora; technologia zastępuje syntetyczny głos sterowany wzrokiem.
  • Altruistyczny projekt zaprezentowany w Alcoy, który może zostać wdrożony w Hiszpanii i Europie, skupiający się na etyce i prywatności.

Sztuczna inteligencja i głos w SLA

Kiedy ALS wycisza głos, zmniejsza również niuanse, które nas definiują: kadencje, akcenty i subtelne modulacje, które kształtują nasz sposób bycia na świecie; odzyskując to głos, tożsamość i więź emocjonalna Dla Fran Vivó, mieszkańca Benaguasil, wydawało się to niemożliwe.

Zespół z Politechniki w Walencji, za pośrednictwem VertexLit (ValgrAI i VRAIN), umożliwił Franowi ponowne mówienie jak on sam, a nie jak maszyna, poprzez rekonstrukcję jego sposobu wyrażania się za pomocą 20 minut nagrań audio i modeli neuronowych szkoleni w szacunku do ich dźwiękowej osobowości.

Od wiadomości WhatsApp do głosu z własnym akcentem

Sztuczna inteligencja i głos dla pacjentów z SLA

Materiał wyjściowy składał się ze starych nagrań audio z WhatsApp w dwóch językach: hiszpańskim i walenckim, zebranych przed postępem choroby; był to minimalny zestaw —tylko 20 minut i dwa języki— ale wystarczająco dużo, aby zbudować niezawodny model.

Wykorzystując sieci neuronowe zaprojektowane do pracy z ograniczoną ilością danych i zdolne do uwzględniania zmian emocjonalnych, zespół stworzył adaptacyjny system, który zachowuje barwa, prozodia i akcent Benaguasil, odchodząc od typowego metalicznego brzmienia syntezatorów.

Niedobór korpusów w języku walenckim wymusił połączenie technik transferu, normalizacji i dostrajania, dzięki czemu uzyskany głos zachował naturalność i przejrzystość nawet jeśli chodzi o języki z małą ilością danych dostępne.

W rezultacie syntetyczny głos, który Fran kontrolował wzrokiem, zostaje zastąpiony jego własnym sposobem mówienia, co pozwala mu ponownie rozpoznać siebie i otoczenie, a także głos robota z tyłu co odpersonalizowało każdą wiadomość.

Zespół i rodzina, które dopracowują każdą frazę

Technologia głosowa dla ALS

Inicjatywa trafiła do VertexLit za sprawą twórcy filmów dokumentalnych Alexa Badii i badaczki iTEAM Gemmę Piñeiro; pracami rozwojowymi kierował Jordi Linares, który zintegrował możliwości VertexLit, ValgrAI i VRAIN (UPV) w tym samym projekcie.

Rodzina Fran korzysta ze specjalnie stworzonego edytora, który pozwala im dostosowywać intonację, akcent i intencję fraza po frazie. W ten sposób technologia przekształca tekst na ich głos, Sztuczna inteligencja zapewnia głos, emocje należą do Ciebie.zachowując swoją tożsamość dźwiękową.

Grupa działała altruistycznie i w celu społecznym: podniesienia świadomości na temat SLA i zapewnienia godnego życia osobom cierpiącym na tę chorobę, pamiętając, że Ten głos nie jest przeznaczony tylko dla Fran.ale ścieżka dla wielu pacjentów, którzy dziś pozostają niewidzialni.

Z Alcoy do reszty Europy: co to oznacza dla ALS

Przypadek ten zaprezentowano na 2. konferencji VRAIN w Alcoy, w UPV, w ramach programu prezentującego inne kierunki badań nad sztuczną inteligencją i komunikacją; tam też humanizujący charakter projektu i jego prezentacja w Alcoy Był to kamień milowy dla Wspólnoty Walenckiej.

Postęp wiąże się z jasnymi zobowiązaniami: świadomą zgodą, ochroną danych głosowych, możliwością śledzenia wykorzystania oraz zabezpieczeniami przed możliwym niewłaściwym wykorzystaniem klonowania głosu, ponieważ kontrola musi pozostać w rękach pacjenta i jego otoczenia; prywatność i kontrola pacjenta Nie są dodatkami, są rdzeniem.

Dzięki wsparciu szpitali, stowarzyszeń i agencji rządowych rozwiązanie można rozszerzyć na Hiszpanię i inne kraje europejskie, integrując się z urządzenia wspomagające komunikację i zmniejszanie kosztów oraz barier użytkowania, tak aby było to dostępne, użyteczne i powtarzalne w różnych kontekstach klinicznych i językowych.

Dla Fran możliwość ponownego usłyszenia siebie oznacza odzyskanie poczucia własnej wartości, ciągłości życia i bliskości z bliskimi; dla społeczności ALS ten kamień milowy potwierdza, że ​​sztuczna inteligencja stosowana z rozwagą i szacunkiem może przywrócić zdolności, tożsamość i godność dla tych, którzy potrzebują największego wsparcia.

kokosowy interfejs
Podobne artykuł:
Coco: aplikacja do przesyłania wiadomości, której klucz jest w głosie