Kiedy ALS wycisza głos, zmniejsza również niuanse, które nas definiują: kadencje, akcenty i subtelne modulacje, które kształtują nasz sposób bycia na świecie; odzyskując to głos, tożsamość i więź emocjonalna Dla Fran Vivó, mieszkańca Benaguasil, wydawało się to niemożliwe.
Zespół z Politechniki w Walencji, za pośrednictwem VertexLit (ValgrAI i VRAIN), umożliwił Franowi ponowne mówienie jak on sam, a nie jak maszyna, poprzez rekonstrukcję jego sposobu wyrażania się za pomocą 20 minut nagrań audio i modeli neuronowych szkoleni w szacunku do ich dźwiękowej osobowości.
Od wiadomości WhatsApp do głosu z własnym akcentem

Materiał wyjściowy składał się ze starych nagrań audio z WhatsApp w dwóch językach: hiszpańskim i walenckim, zebranych przed postępem choroby; był to minimalny zestaw —tylko 20 minut i dwa języki— ale wystarczająco dużo, aby zbudować niezawodny model.
Wykorzystując sieci neuronowe zaprojektowane do pracy z ograniczoną ilością danych i zdolne do uwzględniania zmian emocjonalnych, zespół stworzył adaptacyjny system, który zachowuje barwa, prozodia i akcent Benaguasil, odchodząc od typowego metalicznego brzmienia syntezatorów.
Niedobór korpusów w języku walenckim wymusił połączenie technik transferu, normalizacji i dostrajania, dzięki czemu uzyskany głos zachował naturalność i przejrzystość nawet jeśli chodzi o języki z małą ilością danych dostępne.
W rezultacie syntetyczny głos, który Fran kontrolował wzrokiem, zostaje zastąpiony jego własnym sposobem mówienia, co pozwala mu ponownie rozpoznać siebie i otoczenie, a także głos robota z tyłu co odpersonalizowało każdą wiadomość.
Zespół i rodzina, które dopracowują każdą frazę
Inicjatywa trafiła do VertexLit za sprawą twórcy filmów dokumentalnych Alexa Badii i badaczki iTEAM Gemmę Piñeiro; pracami rozwojowymi kierował Jordi Linares, który zintegrował możliwości VertexLit, ValgrAI i VRAIN (UPV) w tym samym projekcie.
Rodzina Fran korzysta ze specjalnie stworzonego edytora, który pozwala im dostosowywać intonację, akcent i intencję fraza po frazie. W ten sposób technologia przekształca tekst na ich głos, Sztuczna inteligencja zapewnia głos, emocje należą do Ciebie.zachowując swoją tożsamość dźwiękową.
Grupa działała altruistycznie i w celu społecznym: podniesienia świadomości na temat SLA i zapewnienia godnego życia osobom cierpiącym na tę chorobę, pamiętając, że Ten głos nie jest przeznaczony tylko dla Fran.ale ścieżka dla wielu pacjentów, którzy dziś pozostają niewidzialni.
Z Alcoy do reszty Europy: co to oznacza dla ALS
Przypadek ten zaprezentowano na 2. konferencji VRAIN w Alcoy, w UPV, w ramach programu prezentującego inne kierunki badań nad sztuczną inteligencją i komunikacją; tam też humanizujący charakter projektu i jego prezentacja w Alcoy Był to kamień milowy dla Wspólnoty Walenckiej.
Postęp wiąże się z jasnymi zobowiązaniami: świadomą zgodą, ochroną danych głosowych, możliwością śledzenia wykorzystania oraz zabezpieczeniami przed możliwym niewłaściwym wykorzystaniem klonowania głosu, ponieważ kontrola musi pozostać w rękach pacjenta i jego otoczenia; prywatność i kontrola pacjenta Nie są dodatkami, są rdzeniem.
Dzięki wsparciu szpitali, stowarzyszeń i agencji rządowych rozwiązanie można rozszerzyć na Hiszpanię i inne kraje europejskie, integrując się z urządzenia wspomagające komunikację i zmniejszanie kosztów oraz barier użytkowania, tak aby było to dostępne, użyteczne i powtarzalne w różnych kontekstach klinicznych i językowych.
Dla Fran możliwość ponownego usłyszenia siebie oznacza odzyskanie poczucia własnej wartości, ciągłości życia i bliskości z bliskimi; dla społeczności ALS ten kamień milowy potwierdza, że sztuczna inteligencja stosowana z rozwagą i szacunkiem może przywrócić zdolności, tożsamość i godność dla tych, którzy potrzebują największego wsparcia.
