Znane głosy w kooperacji z technologią AI!

NAJLEPSZY VO + LEGALNA AI

W 100% bezpieczne rozwiązania dla profesjonalistów.

AGENCJA VO+AI

VO+AI to wspólny projekt zawodowych lektorów i pierwszego w Polsce internetowego banku głosów Mikrofonika. Pierwsze rozwiązanie łączące możliwości i doświadczenie popularnych i lubianych głosów
z zaletami sztucznej inteligencji. Oparty na legalnych źródłach, w pełni bezpieczny dla obu stron, wyjątkowy system, umożliwiający wykorzystanie lektorów doskonale znanych odbiorcom z radia, telewizji i internetu. 

Pracujemy nad własnymi w pełni autonomicznymi modelami, tworzonymi od podstaw, z zachowaniem indywidualnych cech charakterystycznych dla każdego czytającego. Brzmienie głosu, intonacja, interpretacja a nawet oddechy – to możliwie wierna kopia naszych najlepszych lektorów.

Wspieramy, wyceniamy i autoryzujemy zewnętrzne rozwiązania techniczne, by osiągnąć satysfakcjonujący kompromis pomiędzy technologią, oczekiwaniami stron i bezpieczeństwem naszych głosów.

Chronimy naszych lektorów przed nielegalnym wykorzystaniem ich wyjątkowych umiejętności poprzez zapewnienie im ciągłego monitoringu mediów społecznościowych i tradycyjnych. Zapewniamy opiekę prawną również poza granicami kraju.

Potrzebujesz prawdziwych zawodowców w swoim AI? Zaoferuj swoim klientom teksty wygenerowane przez sztuczną inteligencję, w oparciu o doskonale znane im brzmienie, któremu ufają od dziesiątków lat.

POZNAJ GŁOSY VO+AI

BLOG - KROK PO KROKU

9. Ogólnopolskie Spotkanie Lektorów, organizowane przez bank głosów Mikrofonika to idealne miejsce na prezentację naszych dokonań i postępów. To tam lektorzy mogą …

Kilka dni temu otrzymaliśmy interesujące zapytanie z USA. ➡️ Zapotrzebowanie: 288 natywnych głosów polskich➡️ Projekt: 40-60 minut nagrań audio / 250 krótkich …

Taka prawda. Ukrywaliśmy przed Wami fakt, że Maciej dołączył do naszego projektu już prawie rok temu. Dlaczego? Każdy z naszych wspaniałych głosów …

Jeden z najważniejszych aspektów umowy z naszymi lektorami dotyczy ochrony przed nielegalnym wykorzystaniem ich głosu. Nasza reakcja w takich przypadkach wymaga czasem …

Etyka i legalność

Rozwój technologii AI niesie ze sobą szczególną odpowiedzialność i stawia nas przed nowymi wyzwaniami. Świat się zmienia, ale są w nim pewne stałe zasady. Głos każdego człowieka jest jego wyłączną własnością. Podobnie jak inne charakterystyczne cechy każdego lektora: interpretacja, akcentowanie, frazowanie i wypracowane przez lata pracy wzorce emisji.

Nie jest tajemnicą, że firmy z branży technologicznej nie szanują podstawowych praw osób, których głos pojawia się publicznie. Korzystają z zasobów cyfrowych bez zgody wydawców, emitentów i lektorów – właścicieli tych nagrań. To musi rodzić skutki prawne. A my pilnujemy by miały one realny wymiar.

Projekt VO+AI pokazuje, że można pogodzić interesy wszystkich stron i zaprezentować produkt w 100% zgodny z prawem i podstawowymi zasadami. Każdy lektor, którego głosu użyliśmy w tym projekcie, jest pewien, że będzie miał pełną kontrolę nad projektem, a ewentualne zyski z używania powstałego modelu głosu będą korzystnie dzielone. Gwarantuje mu to jasna i transparentna umowa. Nasi partnerzy mogą być pewni, że będziemy dbać o ich prawa, występować w ich obronie i chronić ich głosy przed nielegalnym wykorzystaniem.

Co roku konsultujemy naszą filozofię rozwoju z lektorami podczas Ogólnopolskiego Spotkania Lektorów. Nasze umowy zostały przedstawione Stowarzyszeniu Lektorów RP, ZASP oraz Związkowi Zawodowemu Twórców Dubbingu.

VO+AI nie ma na celu zastąpienia lektora technologią. Ale rozumie korzyści ze współpracy lektora z technologią. Ma otworzyć klientom nowe możliwości wykorzystania ludzkiego głosu w ich projektach AI. Ma ułatwić dobór odpowiedniego wykonawcy. Ma pomóc montażystom poprawiać uciążliwe błędy oraz uzmysławiać realizatorom różnice i mnogość opcji do wyboru. Ma też pomóc lektorom oszczędzać czas i realizować zadania fizycznie niemożliwe do wykonania. 

Współtworzyć lepsze produkcje.

 

Technologia

W wielkim uproszczeniu dążymy do tego, by nasz projekt umożliwiał stworzenie dokładnej cyfrowej kopii każdego głosu. W oparciu o zrealizowane nagrania, analizujemy za pomocą AI brzmienie, sposób artykulacji, interpretacji, frazowania i oddychania poszczególnych czytających. Staramy się możliwie wiernie odtworzyć te zmienne podczas generowania dźwięków mowy, na podstawie przekazanego pliku tekstowego. Z angielska nazywa się to TTS (text to speech). 

Nasze prace oparte są o technologie dostępne publicznie. Korzystamy z rozwiązań na licencji MIT m. in. GradTTS i HiFi-GAN. Modyfikujemy i ulepszamy autorski silnik stworzony przez Marcina Hajdukiewicza, jednego z pionierów technologii TTS w Polsce, opracowującego rozwiązania w oparciu o technologię AI od 2021 roku. 

Nieustannie szukamy nowych, inspirujących rozwiązań technicznych, które pozwoliłyby na doskonalsze rezultaty. Czekamy na nowe wyzwania i jesteśmy gotowi wnieść swój wkład w rozwój sztucznej inteligencji.

Projekt wspierają