Spis treści
Każdy prawdopodobnie pamięta filmy sprzed lat ukazujące przyszłość jako pełną technologicznych innowacji i niezwykłych rozwiązań. Co prawda większość z nich straciła już „na ważności”, ponieważ lata, w których rzekomo działy się ukazane wydarzenia, w rzeczywistości już minęły i wciąż nie widać latających samochodów na naszym niebie. Nie oznacza to jednak, że dzisiejsza technologia nie zaskakuje, a niektóre jej przejawy faktycznie wydają się wyjęte rodem z filmów science fiction. Dobrym tego przykładem jest SI od Microsoft.
Sztuczna Inteligencja coraz powszechniejsza
Jednym z elementów wielu filmów było i wciąż bywa zagadnienie Sztucznej Inteligencji. Weźmy choćby znakomitego Łowcę Androidów, Matrix czy Terminatora, po których jednak widać, iż technologia ta traktowana jest zazwyczaj z niepokojem i rezerwą. Oczywiście obecne SI nie są tak zaawansowane jak te, ukazane w filmach, ale technologia taka już istnieje. Co więcej, staje się ona coraz bardziej powszechna i ogólnie dostępna, m.in. tworząc niezwykłe obrazy według określonych algorytmów.
SI od Microsoft i naśladowanie głosu
Wiele osób nie zdaje sobie sprawy, że określone SI można dzielić ze względu na stopień zaawansowania. Jedne z prostszych tego typu programów biorą udział przykładowo w przekształcaniu treści mówionych na tekst pisemny. Microsoft postanowił jednak pójść dalej w kwestii Sztucznej Inteligenci związanej z analizą ludzkiego głosu.
Gigant z Redmond ogłosił, iż udało mu się opracować SI, która będzie niemal doskonale imitować dowolny ludzki głos. Dotychczas powstało co prawda kilka podobnych projektów, jednak poza możliwością odtworzenia pewnych cech głosu, pojawiał się zwykle pewien problem. Dotyczył on braku „naturalności” w generowanych mechanicznie, nawet naśladujących ludzki głos wypowiedziach.
Tymczasem Microsoft opracował znacznie bardziej zaawansowane narzędzie tego typu – VALL-E. Sztuczna Inteligencja nawiązująca nazwą do słynnego filmu o sympatycznym robocie robi wrażenie, ponieważ nie tylko jest w stanie wiernie odtworzyć głos, ale też zrobić to w sposób naturalny, a nawet dodając do tego efekty przestrzenne. To wszystko sprawia, że wygenerowane w ten sposób treści są niezwykle realistyczne.
Co więcej, aby nauczyć się wiernego odtworzenia dowolnego głosu ludzkiego, SI od Microsoft potrzebuje zaledwie 3-sekudnowej próbki danego głosu. Źródłem tego może być nagrana rozmowa lub filmik, na którym coś mówimy. Trzeba przyznać, że jest to poniekąd niepokojące i przywodzi na myśl książkę „Żony ze Stepford”, ale narzędzia tego typu dają też duże możliwości i ciekawe perspektywy.
Sprawdź też:
Strefa Biznesu: Nowe zagrożenie cybernetyczne! Tak działają hakerzy
Dołącz do nas na Facebooku!
Publikujemy najciekawsze artykuły, wydarzenia i konkursy. Jesteśmy tam gdzie nasi czytelnicy!
Kontakt z redakcją
Byłeś świadkiem ważnego zdarzenia? Widziałeś coś interesującego? Zrobiłeś ciekawe zdjęcie lub wideo?