AIతో తయారు చేయబడిన “డీప్ఫేక్స్” 2025లో అభివృద్ధి చెందింది మరియు 2026లో మరియు అంతకు మించి పరిస్థితి మరింత దిగజారుతుందని అంచనా.

ఒక సంవత్సరం వేగవంతమైన పురోగతి తర్వాత, డీప్ఫేక్లు వ్యక్తులతో నిజ-సమయ పరస్పర చర్య ద్వారా నిర్వచించబడిన కొత్త శకంలోకి ప్రవేశిస్తున్నాయి.
2025 అంతటా, ది లోతైన నకిలీలు బాగా అభివృద్ధి చెందాయి. ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI)-నిజమైన వ్యక్తులను అనుకరించే ముఖాలు, గాత్రాలు మరియు శరీర ప్రదర్శనల నాణ్యత చాలా మంది నిపుణులు కొన్ని సంవత్సరాల క్రితం ఊహించిన దాని కంటే చాలా పెరిగింది. మరియు వారు ప్రజలను మోసం చేయడానికి కూడా ఎక్కువగా ఉపయోగించబడ్డారు.
అనేక రోజువారీ దృశ్యాలలో – ముఖ్యంగా తక్కువ-రిజల్యూషన్ వీడియో కాల్లు మరియు సోషల్ ప్లాట్ఫారమ్లలో షేర్ చేయబడిన మీడియా – వారి వాస్తవికత ఇప్పుడు నిపుణులే కాని వినియోగదారులను విశ్వసనీయంగా మోసం చేసేంత ఎక్కువగా ఉంది. ఆచరణాత్మక పరంగా, సింథటిక్ మీడియా సాధారణ ప్రజలకు మరియు కొన్ని సందర్భాల్లో సంస్థలకు కూడా ప్రామాణికమైన రికార్డింగ్ల నుండి వేరు చేయలేనిదిగా మారింది.
మరియు ఈ పురోగతి నాణ్యతకు పరిమితం కాదు. యొక్క వాల్యూమ్ లోతైన నకిలీలు సర్క్యులేషన్ పేలుడుగా పెరిగింది: సైబర్ సెక్యూరిటీ సంస్థ డీప్స్ట్రైక్ సుమారు 500,000 పెరుగుదలను అంచనా వేసింది లోతైన నకిలీలు 2023లో ఆన్లైన్లో 2025లో 8 మిలియన్లకు చేరుకుంది, వార్షిక వృద్ధి 900%కి దగ్గరగా ఉంటుంది.
నేను పరిశోధన చేసే కంప్యూటర్ సైంటిస్ట్ని లోతైన నకిలీలు మరియు ఇతర సింథటిక్ మీడియా. నా దృష్టికోణంలో, 2026 నాటికి పరిస్థితి మరింత దిగజారుతుందని నేను చూస్తున్నాను లోతైన నకిలీలు నిజ సమయంలో వ్యక్తులకు ప్రతిస్పందించగల సింథటిక్ కళాకారులుగా మారండి.
నేడు, ఆచరణాత్మకంగా ఎవరైనా డీప్ఫేక్ వీడియోను రూపొందించవచ్చు.
నాటకీయ మెరుగుదలలు
ఈ నాటకీయ ఆరోహణ వెనుక అనేక సాంకేతిక మార్పులు ఉన్నాయి. ముందుగా, వీడియో రియలిజం ఒక ముఖ్యమైన పురోగతిని సాధించింది, ఇది తాత్కాలిక అనుగుణ్యతను కొనసాగించడానికి ప్రత్యేకంగా రూపొందించబడిన వీడియో జనరేషన్ మోడల్లకు ధన్యవాదాలు. ఈ నమూనాలు పొందికైన కదలికలు, చిత్రీకరించబడిన వ్యక్తుల స్థిరమైన గుర్తింపులు మరియు ఒక ఫ్రేమ్ నుండి మరొక ఫ్రేమ్కి అర్ధమయ్యే కంటెంట్తో వీడియోలను ఉత్పత్తి చేస్తాయి. మోడల్లు కదలిక గురించిన సమాచారం నుండి వ్యక్తి యొక్క గుర్తింపును సూచించడానికి సంబంధించిన సమాచారాన్ని వేరు చేస్తాయి, తద్వారా ఒకే కదలికను వేర్వేరు గుర్తింపులకు మ్యాప్ చేయవచ్చు లేదా ఒకే గుర్తింపు అనేక రకాల కదలికలను కలిగి ఉంటుంది.
ఈ నమూనాలు కళ్ళు మరియు దవడ చుట్టూ మినుకుమినుకుమనే, వార్పింగ్ లేదా నిర్మాణ వైకల్యాలు లేకుండా స్థిరమైన, పొందికైన ముఖాలను ఉత్పత్తి చేస్తాయి, ఇవి గతంలో విశ్వసనీయమైన ఫోరెన్సిక్ సాక్ష్యంగా పనిచేశాయి. లోతైన నకిలీలు.
రెండవది, వాయిస్ క్లోనింగ్ నేను “అస్పష్టమైన థ్రెషోల్డ్” అని పిలుస్తాను. సహజమైన స్వరం, లయ, ఉద్ఘాటన, ఉద్వేగం, పాజ్లు మరియు శ్వాస శబ్దంతో పూర్తి – ఇప్పుడు నమ్మదగిన క్లోన్ని రూపొందించడానికి కొన్ని సెకన్ల ఆడియో సరిపోతుంది. ఈ సామర్థ్యం ఇప్పటికే పెద్ద ఎత్తున మోసానికి ఆజ్యం పోస్తోంది. కొంతమంది పెద్ద రిటైలర్లు రోజుకు 1,000 కంటే ఎక్కువ AI- రూపొందించిన స్కామ్ కాల్లను స్వీకరిస్తున్నట్లు నివేదిస్తున్నారు. ఒకప్పుడు సింథటిక్ స్వరాలకు ద్రోహం చేసిన గ్రహణ సంకేతాలు చాలా వరకు అదృశ్యమయ్యాయి.
మూడవదిగా, ఉత్పత్తి సాధనాలు సాంకేతిక అవరోధాన్ని దాదాపు సున్నాకి తగ్గించాయి. OpenAI యొక్క Sora 2 మరియు Google యొక్క Veo 3కి అప్డేట్లు మరియు స్టార్టప్ల వేవ్, ఎవరైనా ఒక ఆలోచనను వివరించవచ్చు మరియు OpenAI యొక్క ChatGPT లేదా Google యొక్క జెమిని వంటి గొప్ప భాషా మోడల్ను స్క్రిప్ట్ను వ్రాయవచ్చు మరియు నిమిషాల్లో అధునాతన ఆడియోవిజువల్ మీడియాను రూపొందించవచ్చు. AI ఏజెంట్లు మొత్తం ప్రక్రియను ఆటోమేట్ చేయగలరు. ఉత్పత్తి చేసే సామర్థ్యం లోతైన నకిలీలు పొందికైన మరియు పెద్ద ఎత్తున స్క్రిప్ట్ ప్రభావవంతంగా ప్రజాస్వామ్యీకరించబడింది.
ఈ పెరుగుతున్న సంఖ్యలు మరియు అక్షరాల కలయిక వాస్తవ మానవుల నుండి దాదాపుగా గుర్తించలేని విధంగా గుర్తించడంలో తీవ్రమైన సవాళ్లను సృష్టిస్తుంది. లోతైన నకిలీలుప్రత్యేకించి మీడియా ఎకోసిస్టమ్లో ప్రజల దృష్టి విచ్ఛిన్నమై, కంటెంట్ ధృవీకరించబడే దానికంటే వేగంగా కదులుతుంది. వాస్తవ ప్రపంచ హాని ఇప్పటికే జరిగింది – తప్పుడు సమాచారం నుండి లక్ష్యంగా వేధింపులు మరియు ఆర్థిక స్కామ్ల వరకు – దీని ద్వారా సాధ్యమైంది లోతైన నకిలీలు ప్రజలు ఏమి జరుగుతుందో తెలుసుకునే అవకాశం రాకముందే అది వ్యాపిస్తుంది.
AI పరిశోధకుడు హనీ ఫరీద్ ఎలా వివరించాడు లోతైన నకిలీలు పని మరియు వారు ఎలా మెరుగవుతున్నారు మరియు మెరుగవుతున్నారు.
భవిష్యత్తు నిజ సమయంలో ఉంది
భవిష్యత్తును పరిశీలిస్తే, వచ్చే ఏడాది పథం స్పష్టంగా ఉంది: లోతైన నకిలీలు నిజ-సమయ సంశ్లేషణ వైపు కదులుతున్నాయి, మానవ రూపానికి సంబంధించిన సూక్ష్మ నైపుణ్యాలను దగ్గరగా పోలి ఉండే వీడియోలను రూపొందించగల సామర్థ్యాన్ని కలిగి ఉంటాయి, తద్వారా వాటిని గుర్తించే వ్యవస్థల నుండి తప్పించుకోవడం సులభం అవుతుంది. సరిహద్దు స్టాటిక్ విజువల్ రియలిజం నుండి టెంపోరల్ మరియు బిహేవియరల్ కోహెరెన్స్కి మారుతోంది: ముందుగా రెండర్ చేసిన క్లిప్ల కంటే లైవ్ లేదా సమీప-లైవ్ కంటెంట్ను రూపొందించే మోడల్లు.
ఐడెంటిటీ మోడలింగ్ అనేది ఒక వ్యక్తి ఎలా కనిపిస్తుందో మాత్రమే కాకుండా, వారు వివిధ సందర్భాలలో ఎలా కదులుతారో, ధ్వనించే మరియు మాట్లాడే విధానాన్ని కూడా సంగ్రహించే ఏకీకృత వ్యవస్థల వైపు కలుస్తోంది. ఫలితం “ఇది వ్యక్తి X వలె కనిపిస్తుంది” నుండి “ఇది కాలక్రమేణా X వ్యక్తి వలె ప్రవర్తిస్తుంది.” వీడియో కాల్లో పాల్గొనే వారందరూ నిజ సమయంలో వినగలరని నేను ఆశిస్తున్నాను; AI-ఆధారిత ఇంటరాక్టివ్ నటులు, వారి ముఖాలు, గాత్రాలు మరియు ప్రవర్తనలు తక్షణమే ఆదేశానికి అనుగుణంగా ఉంటాయి; మరియు స్కామర్లు స్టిల్ వీడియోలకు బదులుగా ప్రతిస్పందించే అవతార్లను ఉపయోగిస్తున్నారు.
ఈ సామర్థ్యాలు పరిపక్వం చెందుతున్నప్పుడు, సింథటిక్ మరియు ప్రామాణికమైన మానవ మాధ్యమాల మధ్య గ్రహణ వ్యత్యాసం తగ్గుతూనే ఉంటుంది. రక్షణ యొక్క ముఖ్యమైన రేఖ మానవ తీర్పు నుండి దూరంగా ఉంటుంది. బదులుగా, ఇది మౌలిక-స్థాయి రక్షణలపై ఆధారపడుతుంది. ఇందులో క్రిప్టోగ్రాఫికల్గా సంతకం చేయబడిన మీడియా మరియు AI కంటెంట్ సాధనాల వంటి సురక్షితమైన ఆధారాలు ఉన్నాయి, ఇవి కంటెంట్ ప్రోవెన్స్ మరియు అథెంటిసిటీ స్పెసిఫికేషన్ల కోసం కూటమిని ఉపయోగిస్తాయి. ఇది నా ల్యాబ్ యొక్క డీప్ఫేక్-ఓ-మీటర్ వంటి మల్టీమోడల్ ఫోరెన్సిక్ సాధనాలపై కూడా ఆధారపడుతుంది.
చిత్రాలలోని పిక్సెల్లను మరింత దగ్గరగా చూస్తే సరిపోదు.
Siwei Lyu ఈ కథనం యొక్క ప్రచురణ నుండి ప్రయోజనం పొందే ఏ కంపెనీ లేదా సంస్థ నుండి సంప్రదించడం, పని చేయడం, స్వంత వాటాలు లేదా నిధులను పొందడం లేదు మరియు అతని విద్యాసంబంధమైన స్థితికి మించిన సంబంధిత సంబంధాలను వెల్లడించలేదు.



-1jxzgn2vw3arc.png?w=390&resize=390,220&ssl=1)