3-30sAIclone modelcloned

Voice Deepfakes

11 min lukeaTurvallisuus

Muutama sekunti jonkun ääntä riittää kloonaamaan hänen äänensä vakuuttavasti. Tekniikka oli tutkimusuteliaisuutta vuoteen 2023 asti; vuonna 2024 siitä tuli hyödyke. Petostiimit raportoivat, että isovanhempia, johtajia ja vanhempia vastaan ​​tehdyt puheen toisena henkilönä esiintyvät huijaukset ovat lisääntyneet jyrkästi – ja puolustus ei ole saanut kiinni.

Artikkelin koko runko on englanniksi alla.

Voice deepfakes ovat tekoälyn luomia äänileikkeitä, jotka jäljittelevät vakuuttavasti tietyn henkilön ääntä. Nykyaikaiset mallit (Eleven Labs, OpenAI Voice Engine, Microsoft VALL-E ja monet avoimen lähdekoodin vaihtoehdot) voivat kloonata kohdeäänen 3–30 sekunnin viiteäänestä. Tulos on riittävän hyvä useimpien kuuntelijoiden huijaamiseen useimmissa yhteyksissä.

Kuinka kloonaus toimii

Yleinen malli:

  1. Kokeile perusäänimalli suurelle tietojoukolle erilaisia ​​ääniä, jotka puhuvat erilaista sisältöä. Tämä kaappaa ihmisen puheen yleisen rakenteen.
  2. Tarjoa lyhyt viiteleike kohdeäänestä. Malli erottaa puheen upotuksen – korkeaulotteisen vektorin, joka vangitsee puhujan ominaisuudet.
  3. Luo uutta puhetta yhdistämällä mielivaltainen teksti puheen upotukseen. Lähtö kuulostaa siltä, ​​että kohde puhuu tekstiä.

Nykyaikaiset järjestelmät myös kloonaavat tunnesävyn, korostuksen ja puhenopeuden. Tekniikka on muuttunut "huolellisella kuuntelulla tunnistettavissa olevasta" vuonna 2022 "usein erottumattomaksi todellisesta äänestä" vuonna 2025.

Petosmallit

  • Isovanhempien huijaukset. – kuin puhelu isoäidiltä tai puhelut, jotka tarvitsevat rahaa. siirto. Äänikloonaus poistaa historiallisen puolustuksen "se ei kuulosta siltä". Useat lainkäyttöalueet raportoivat merkittävistä lisäyksistä.
  • CEO-petos / yrityssähköpostin kompromissi puhemuunnelma. Puhelu taloushallinnon työntekijälle henkilöltä, joka kuulostaa pankkisiirron valtuutetulta toimitusjohtajalta. Arup Hongkongin tapaus (2024) – 25 miljoonan dollarin menetys – yhdistetty kloonattu ääni syvään fake-videoon Zoom-puhelussa.
  • Pankkitodennuksen ohitus. Jotkut pankit käyttävät puhebiometrisiä tietoja puhelinpankkien todentamiseen. Äänikloonauksen on osoitettu voittavan nämä järjestelmät useissa pankeissa vuodesta 2023 lähtien.
  • Poliittiset ja mainehyökkäykset. Robokutsut poliitikkojen äänissä – väärennetty Bidenin robottipuhelu edelsi vuoden 2024 New Hampshiren esivaaleja, mikä johti FCC:n täytäntöönpanoonPLZ73XXPLX3PLZ3 häirintä. Kloonattuja ääniä käytetään todisteiden valmistamiseen perhetuomioistuinriidoissa, työriidoissa ja häirintäkampanjoissa.

Mistä äänilähde tulee

Hyödyllisen kloonin luominen vaatii vain sekunnin lähdeääntä. Lähteitä on runsaasti:

  • Puhepostitervehdys
  • Sosiaalisen median videot (TikTok, Instagram Stories, YouTube)
  • Konferenssikeskustelut ja podcastit
  • Pub-puhelut johtajat
  • Puheviestit WhatsAppissa tai Signaalissa, jotka vastaanottaja jakaa
  • Puheviestit, jotka jätettiin yrityksiin

Useimmille ihmisille vuonna 2026 on olemassa tarpeeksi lähdeääntä julkisesti luomaan vakuuttavaa ääntä661PLZXXPLZ-ääntä vastaan. deepfakes

Tekninen tunnistus on epäluotettava. Äänen syvän väärennösten tunnistuksen nykyinen tila vastaa suunnilleen 2020-luvun alun kuvan syvän väärennösten tunnistusta – toimii joissakin tapauksissa, epäonnistuu toisissa, ei pysy mallin parannuksissa.

Proseduaaliset suojaukset ovat luotettavampia:

  • XPLZ70'XD7 Äänen vahvistus1. yksin suurten panosten toimiin. Soita takaisin tunnettuun numeroon. Käytä videopuhelua, jos voit.
  • Koodilausekkeet. Petostentorjuntaryhmät suosittelevat yhä useammin perhekoodilauseita hätärahoituspyyntöihin.
  • Henkilökohtaisia ​​tietoja koskevat kysymykset. "Mikä oli ensimmäisen koiramme nimi?" Asiat, joita klooni ei voi poimia julkisista lähteistä.
  • Prosessipohjainen todentaminen. Yritysrahoitustiimien tulee vaatia usean henkilön hyväksyntä ja ennalta määritettyjä kanavia pankkisiirroille riippumatta siitä, kuka soittaa ja miltä ne kuulostavat.
  • S-sosiaalisen kiireellisyyden klassikkoPLZ86X7. kerro - "tämän on tapahduttava heti" - pätee. Todelliset hätätilanteet, jotka edellyttävät pankkisiirtoja ilman vahvistusta, ovat häviävän harvinaisia.

Pankki- ja puhebiometriset tiedot

Usat suuret pankit siirtyivät käyttämään biometristä äänitodennusta puhelinpankkitoiminnassa 2010-luvulla. Hyökkäyspinta oli tuolloin hyväksyttävä. Nykyaikaisessa puhekloonauksessa puhebiometriset tiedot eivät yksinään ole puolustettava toinen tekijä. Pankit ovat siirtymässä kerrosvahvistukseen, mutta siirtyminen on epätasaista.

IJos pankkisi hyväksyy edelleen puhetodennuksen, harkitse sen poistamista käytöstä tai täydentämistä muilla vahvistusmenetelmillä.

Poliittinen ulottuvuus

Vähennelmä poliittinen disinformaatio tuli totta vuosina 2023–2024. FCC päätti helmikuussa 2024, että tekoälyn tuottamat äänet robottipuheluissa ovat puhelimen kuluttajansuojalain alaisia. Useat maat ovat ehdottaneet syväväärennösten paljastamislakeja. Täytäntöönpano on epätasaista; tekniikka kehittyy nopeammin kuin politiikka.

Äänestäjille ja kansalaisille: oletetaan, että julkisuuden henkilöiden kiistanalainen ääni saattaa olla synteettistä, varsinkin jos se sopii kätevästi puolueelliseen kertomukseen. Tarkista ennen jakamista.

Tavallisille käyttäjille

Kolme tapaa, jotka vähentävät merkittävästi riskiä:

  • Luo koodilause perheenjäsenten kanssa jokaista aitoa hätärahapyyntöä varten. Käytä sitä.
  • Älä koskaan hyväksy rahaa tai arkaluontoisia toimia pelkän äänen perusteella. Tarkista aina kaistan ulkopuolisuus.
  • IJos saat kiireellisen rahapuhelun, hidasta nopeutta, katkaise puhelu ja soita takaisin numerosta, joka sinulla oli jo – ei numerosta, johon soitit.

Usein kysytyt kysymykset

Voinko tunnistaa syvän fake-äänen korvalla?
Joskus - liian täydellinen prosodia, lievä robottitonaliteetti pitkissä lauseissa, yhteensopimaton ympäristön kohina. Nykyaikaiset järjestelmät ovat niin hyviä, että korvalla havaitseminen on epäluotettavaa. Menettelyllinen todentaminen on tärkeämpää kuin havaitsemistaito.
Kuinka paljon ääntä tarvitaan äänen kloonaamiseen?
Kaupalliset järjestelmät toimivat jo 3 sekunnissa. Parempi laatu 30 sekunnista muutamaan minuuttiin. Useimmille julkisuuden henkilöille ja aktiivisille sosiaalisen median käyttäjille riittävä lähdeääni löytyy helposti verkosta.
Onko olemassa tunnistustyökaluja, jotka toimivat?
Kyllä tietyissä tuotantojärjestelmissä ja tietyissä skenaarioissa. Havaitseminen toimii parhaiten toisen vaiheen tarkastuksena sen jälkeen, kun epäilyt ovat jo heränneet muista syistä. Operatiiviset puolustukset (varmistuskutsut, koodilauseet) ovat petosten estämisessä luotettavampia kuin havaitseminen.
Onko äänen kloonaus laillista?
Kloonin luominen on yleensä laillista. Sen käyttäminen petoksen tekemiseen, kunnianloukkaamiseen tai toisena henkilönä esiintymiseen rikollisen hyödyn saamiseksi on laitonta. Useilla lainkäyttöalueilla on nyt erityisiä syväväärennösten paljastamista koskevia lakeja. Työkalut ovat kaksikäyttöisiä; laillisuus seuraa käyttöä.
Pitäisikö pankkien lopettaa äänibiometriikan käyttö?
Ainoana toisena tekijänä kyllä. Ääni + lisävahvistus (sijainti, laite, tilihistoria) on puolustettavampi. Useat suuret pankit ovat jo luopuneet pelkästä äänitodennuksen käytöstä; toiset ovat vielä siirtymävaiheessa.
Voice Deep Fakes selitetty: Kuinka tekoälyn kloonattuja ääniä käytetään petoksiin