com treure musica dun videoaislar vocalsedicio audio de videoseparador audio iacreacio de contingut

Com treure la música d'un vídeo - Mantén les vocals el 2026

Marcus Rodriguez
Marcus Rodriguez
Expert en producció de vídeo

Aprèn com treure la música d'un vídeo mantenint el diàleg amb eines d'IA, programari d'escriptori i aplicacions mòbils el 2026.

Has gravat un vídeo fantàstic, però l'àudio és un desgavell. Potser és una cançó amb copyright que et farà detectar, o potser la música ja no s'ajusta a l'estil que vols aconseguir. Saber com eliminar la música d'un vídeo és una habilitat clau per a qualsevol creador. Pots optar per una solució ràpida mutlejant tota la pista d'àudio, però la veritable màgia passa quan pots separar la música de les veus, mantenint el teu diàleg original perfecte.

Per què necessites separar l'àudio dels teus vídeos

Has gravat un clip genial, però has adonat que la música de fons el fa totalment inúsable? M'hi he trobat més vegades dels que puc comptar. És un mal de cap clàssic per als creadors, especialment quan una pista amb copyright provoca notificacions d'eliminació o vídeos muts a YouTube i Instagram. Poder separar netament l'àudio del vídeo no és només un extra; és un canvi total de joc.

Pensa-hi. Tens un TikTok digne de viral amb una cançó de tendència —i molt protegida per copyright—. El vídeo en si és or pur i seria perfecte per a un anunci de marca, però utilitzar aquesta música és legalment impossible. En lloc de llençar-ho tot, pots eliminar només la música mantenint el diàleg original de la persona. El que abans era un problema ara es converteix en un actiu valuós per a la teva campanya de màrqueting.

Reutilitza el contingut amb confiança

Aquesta habilitat és absolutament essencial si vols treure més partit al teu material existent. Per exemple, pots agafar un vídeo i transformar-lo en diverses peces de contingut diferents.

  • Modifica les teves entrevistes: Tens una entrevista amb música molestosa d'una cafeteria de fons? Elimina-la. Ara tens una base neta per afegir un voiceover professional o la teva banda sonora de marca.
  • Crea un podcast a partir d'un webinar: Mutar un vídeo és una cosa, però dominar l'extracció i neteja d'àudio de vídeos et permet convertir contingut de vídeo en episodis de podcast d'alta qualitat.
  • Adapta'l a diferents plataformes socials: L'àudio que funciona a TikTok potser no passa a LinkedIn. Eliminar la música original et dona llibertat per adaptar el so a cada audiència específica.

Durant anys, el major obstacle era sempre salvar el diàleg. Mutar un vídeo és fàcil, però sovint significa sacrificar totes les paraules parlades. Per separar netament les veus de la música, necessitaves un enginyer d'àudio i un pressupost per a programari car.

L'objectiu real no és només mutar un clip. Es tracta d'eliminar quirúrgicament la música no desitjada per mantenir el diàleg valuós, desbloquejant un munt de noves possibilitats per al teu contingut.

Gràcies als instruments d'AI moderns, el joc ha canviat completament, fent aquest procés accessible per a tothom. Aquestes plataformes poden analitzar una pista d'àudio i aïllar intel·ligentment les diferents capes —veus, música, fins i tot efectes sonors— en fitxers separats. Aquesta tecnologia dóna als creadors el poder de rescatar i reutilitzar material que hauria estat inúsable fa uns quants anys. Sigui que siguis un gestor de xarxes socials creant AI UGC ads o un vlogger netejant material, la separació d'àudio és una habilitat que vols al teu kit d'eines.

De vegades, no necessites un suite d'edició complet per arreglar l'àudio del teu vídeo. Sigues honest, la majoria de vegades només necessites una solució ràpida i efectiva per publicar el contingut. Saber com mutar o substituir l'àudio ràpidament és una habilitat essencial, especialment quan crees contingut sobre la marxa per a xarxes socials.

La solució més ràpida sovint és la més senzilla: muta tot el clip. És un tot o res, segur, però és perfecte per a aquells moments en què l'àudio original és un cas perdut. Pensa en un clip arruïnat per soroll de vent excessiu, o un vídeo d'un esdeveniment on sona música amb copyright a tot volum de fons. Mutar et dona una base neta, a punt per a un so de tendència, una pista musical fresca o el teu propi voiceover.

No estàs segur si salvar l'àudio o llençar-lo? Aquest petit arbre de decisions et pot guiar en la direcció correcta.

Decision tree flowchart for video audio, guiding users to keep or remove based on clarity and relevance.

Finalment, tot es redueix a una pregunta senzilla: l'àudio afegeix valor? Si la resposta és no, o si provoca un problema (com una reclamació de copyright), la millor opció és eliminar-lo.

Per a aquestes solucions ràpides, probablement ja tens tot el que necessites. Aquí tens una mirada als mètodes més ràpids per fer-ho.

Maneres més ràpides de mutar o substituir l'àudio d'un vídeo

Tria el millor mètode per mutar o substituir l'àudio segons el teu dispositiu i l'objectiu desitjat.

EinaMillor perAvantatgesDesavantatges
Editor natiu del telèfon (iOS/Android)Crear un clip silenciós ràpidament per utilitzar-lo en altres apps o com a B-roll net.- Completament gratuït i integrat
- Extremadament ràpid; només segons
- Desa un fitxer silenciós nou i separat
- Muta tot l'àudio; sense separació
- Sense opció d'afegir nou àudio directament
App de xarxes socials (TikTok, Instagram)Mutar l'àudio original i substituir-lo immediatament per un so de tendència o música.- Flux de treball sense interrupcions; sense sortir de l'app
- Accés a la biblioteca de música llicenciada de la plataforma
- Desplaçadors fàcils d'utilitzar per als nivells d'àudio
- Les edicions estan lligades a aquesta plataforma específica
- Menys control que un editor dedicat
- La interfície pot canviar amb les actualitzacions de l'app

Aquestes eines són la teva primera línia de defensa per als problemes d'àudio. Anem a veure com utilitzar-les.

Utilitza l'editor integrat del teu telèfon

No subestimes el poder del dispositiu que tens a la butxaca. Tant els iPhone com els Android tenen funcions d'edició senzilles integrades directament a les seves apps de fotos que poden mutar un vídeo en només un parell de tocs.

Si estàs en un iPhone o iPad, obre el teu vídeo a l'app Fotos i toca Edita. A la cantonada superior esquerra, veuràs un petit ícone de parlador groc. Toca'l. Es tornarà gris, indicant que l'àudio ara està mut. Toca Fet, i tindràs una versió totalment nova i silenciosa del teu clip.

El procés és gairebé idèntic a Android. Obre el teu vídeo a la Galeria o l'app Google Photos i troba l'opció Edita. Busca l'ícone de parlador o so, toca'l per mutar i després desa el treball. La ubicació exacta pot variar una mica segons si tens un Samsung, Pixel o un altre dispositiu, però l'ícone gairebé sempre hi és.

Utilitzo aquest truc constantment quan només necessito un clip de B-roll silenciós per inserir en un projecte més gran sense preocupar-me pel soroll de fons que xoqui.

Mutar directament a les apps de xarxes socials

Si la destinació final del teu vídeo és una plataforma social, per què no editar-lo allà? Apps com TikTok, Instagram i YouTube Shorts tenen els seus propis editors dissenyats exactament per aquest tipus d'ajustos ràpids.

Per exemple, quan crees un Instagram Reel, pots tocar l'ícone de nota musical per obrir els controls d'àudio. Veureu un desplaçador per a "Camera audio": només arrossega'l completament a 0. Això muta totalment el teu clip original, alliberant-te per afegir una pista de la biblioteca musical d'Instagram o gravar un voiceover sense que hi hagi cap so que es filtrin.

La meva opinió: Mutar directament a l'app és increïblement eficient, però sempre previa el teu post abans de tocar "Comparteix". He vist actualitzacions d'apps que mouen les coses o introdueixen errors. Una ràpida comprovació final et pot estalviar l'embaràs de publicar un vídeo amb àudio baratjat.

Aquestes tècniques bàsiques de mutació són habilitats fonamentals per a qualsevol creador. Tot i que no ofereixen la precisió d'eines més avançades, resolen un munt de maldecaps d'àudio quotidians. Per als creadors que també gestionen anuncis de pagament, dominar aquestes edicions ràpides és clau per produir actius ràpidament. Si busques més maneres d'optimitzar la creació de contingut, consulta la nostra guia sobre com utilitzar un AI ad generator per convertir idees senzilles en anuncis de vídeo polits.

Separa la música de les veus amb eines d'àudio d'AI

Mutar l'àudio és la solució ràpida i efectiva, però què passa quan necessites mantenir el diàleg? Aquí és on les coses es tornen realment interessants. Parlem de separació d'àudio amb AI, un procés que potser has sentit anomenar stem splitting.

Aquesta tecnologia és un salvavides. S'endinsen en l'àudio del teu vídeo, distingeixen què és parla i què és música, i els separen en pistes editables independents.

Fa només uns quants anys, això era alguna cosa que només podien fer enginyers d'àudio professionals amb programari caríssim. Ara, eines d'AI potents i accessibles permeten a qualsevol eliminar quirúrgicament la música de fons mantenint les veus perfectament clares.

Diguem que un client t'envia un vídeo testimonial increïble. El contingut és or pur, però l'han gravat amb una cançó popular i amb copyright sonant a tot volum de fons. No pots utilitzar-ho per a un anunci de xarxes socials sense arriscar una reclamació de copyright. En lloc de demanar que el refacin, pots utilitzar una eina d'AI per eliminar la música, deixant-te una pista vocal neta que pots utilitzar de veritat.

Com funciona el stem splitting amb AI

Doncs, com ho fa? Aquestes eines estan entrenades amb biblioteques gegants d'àudio, aprenent a distingir les freqüències d'una veu humana d'un riff de guitarra o un cop de bateria, per exemple. Quan puges el teu vídeo, l'AI "escolta" tota la mescla i escup fitxers d'àudio separats per a cada part que identifica.

Gairebé sempre obtindràs almenys dues pistes:

  • Vocals: Només el diàleg parlat del teu vídeo.
  • Instrumental: Aquesta pista conté tot el reste: la música de fons, soroll ambiental i qualsevol efecte sonor.

Des d'aquí, pots llençar la pista instrumental. Et queda un diàleg net, a punt perquè hi superposis música sense royalties o gravis un voiceover fresc al teu editor de vídeo.

Utilitza un separador d'àudio d'AI en línia

Ara hi ha un munt d'eines en línia per a això, i totes funcionen d'una manera bastant similar. El flux de treball bàsic és senzill: puja el teu vídeo, deixa que l'AI faci la màgia i després baixa els stems d'àudio separats.

La majoria d'interfícies fan molt clar què obtens. Pots veure exactament com l'AI ha dividit el so original en diferents pistes.

A person uses a laptop for AI vocal splitting, showing music and vocal tracks on screen.

La imatge d'arriba mostra un exemple perfecte. L'àudio original s'ha descompost en una pista "Music" i una pista "Vocals", cadascuna amb els seus propis controls. Aquest tipus de control granular és el que fa aquestes eines tan potents per als creadors.

Quan triïs una eina, val la pena comparar. Molts suites d'edició de vídeo moderns integren aquesta funció directament, així que mira diferents plataformes i les seves alternatives com Veed.io per veure quina s'ajusta millor al teu flux de treball.

Una comprovació de realitat ràpida: La qualitat final depèn realment de l'àudio d'origen. Si la música és ensordidora i el parlant murmura, l'AI pot deixar algun fragment de so o "artifacts". Per a la majoria de contingut de xarxes socials, però, els resultats són més que bons.

Consells per obtenir els millors resultats

Tot i que l'AI fa la major part del treball pesat, una mica de preparació va molt lluny. Comença sempre amb el fitxer de vídeo de la màxima qualitat que tinguis. Si treballes amb un clip que s'ha baixat i pujat dotzenes de vegades, l'àudio comprimit donarà molt més feina a l'AI.

Aquí tens uns quants consells que he après per experiència:

  • Comença amb un àudio genial: Millor és el fitxer d'origen, més neta serà la separació. Evita àudio molt comprimit o de baixa qualitat sempre que puguis.
  • Escolta amb auriculars: Després que l'AI acabi, posa't uns auriculars i escolta de prop la pista només de veus. Encara sents fragments de la cançó? El diàleg és ofegat o clar?
  • Prova una altra eina: No tots els models d'AI són iguals. Si una eina no ho clava del tot, no tinguis por de provar-ne una altra. Algunes són millors per a mescles d'àudio molt desordenades o complexes.

Honestament, aprendre com eliminar la música d'un vídeo d'aquesta manera és un canvi de joc. Et permet rescatar material valuós, evitar maldecaps de copyright i prendre control creatiu total del so del teu projecte.

Per al control absolut, ves a l'escriptori

Mira, aquestes eines d'AI d'un clic són fantàstiques quan tens pressa. Però quan necessites precisió absoluta, és hora d'encendre el teu programari d'edició de vídeo d'escriptori. Per als creadors professionals, aquí és on passa la veritable màgia. Tenir control granular sobre l'àudio és innegociable, i programes potents com Adobe Premiere Pro i DaVinci Resolve estan fets per a això.

Pensa en un escenari real. Estàs editant un testimonial clau de client per a una campanya de màrqueting. El missatge del parlant és or pur, però un jingle repetitiu i feble d'una oficina propera s'infiltra a l'àudio. Una eina en línia ràpida potser no el detecta o crea artifacts estranys intentant eliminar-lo. Aquí és on un editor d'escriptori demostra el seu valor, permetent-te atacar quirúrgicament i reduir aquestes freqüències musicals específiques sense malmetre el diàleg.

Això és exactament per què les cases de producció i els YouTuber seriosos viuen pràcticament en aquestes aplicacions. És la diferència entre un vídeo que sona "bé" i un que sona realment professional.

Les eines integrades són el teu primer pas

La bona notícia és que els editors de vídeo moderns (sovint anomenats editors no lineals, o NLE) ara estan plens de funcions d'AI potents propis. No sempre has de buscar un plugin de tercers.

A Adobe Premiere Pro, per exemple, pots trobar l'eina Vocal Enhancer dins del panell Essential Sound. Està dissenyada per millorar el diàleg, però ajustant els seus paràmetres, pots relegar la música de fons tan enrere que ja no molesta.

A DaVinci Resolve, l'efecte "Voice Isolation" és un canvi de joc. És una meravella d'un clic que utilitza un model d'AI per analitzar el so i separar netament la parla de tot el reste. Funciona sorprenentment bé directament de la caixa, però el seu veritable poder és com a punt de partida per a treballs més detallats.

Anar quirúrgic amb la pàgina Fairlight de DaVinci Resolve

DaVinci Resolve és un favorit particular per aquest tipus de treball perquè la seva suite d'àudio de grau professional, coneguda com la pàgina Fairlight, està inclosa a la versió completament gratuïta. No parlem d'una eina lleugera o limitada; aquesta és una estació de treball d'àudio digital (DAW) completa integrada directament al teu editor.

Anem a veure un problema comú: tens un clip d'entrevista genial, però una pista musical amb baixos pesats fa que el parlant soni fangós.

Primer, amb el teu clip a la línia de temps, clica la pestanya Fairlight (sembla una petita nota musical) a la part inferior de la pantalla. Selecciona el teu clip d'àudio i, al panell Inspector a la dreta, veuràs una pestanya "Audio". Troba l'efecte "Voice Isolation", activa'l i juga amb el dial. Probablement et sorprendrà quant de més net es torna l'àudio immediatament.

Però no t'aturis aquí. Per al fi ajust, ves al panell "Mixer" i troba la pista d'àudio amb què estàs treballant. Double-clic a la secció "EQ", que obrirà la finestra Equalizer.

L'Equalizer (o EQ) és la teva arma secreta. Et dóna el poder d'augmentar o tallar freqüències d'àudio molt específiques. Com que les veus humanes i la música de fons sovint viuen en rangs de freqüència diferents, pots utilitzar l'EQ per esculpir espai perquè el diàleg brilli.

Per exemple, el nucli de la parla humana cau entre 85 Hz i 255 Hz. Si aquesta música molestosa té una línia de baix potent, pots utilitzar l'EQ per tallar dramàticament totes les freqüències per sota de 80 Hz. Això matarà els baixos sense tocar mai la veu del parlant. Després pots escoltar altres freqüències musicals dominants i baixar-les suaument també.

Aquest enfocament manual requereix pràctica —i definitivament vols uns bons auriculars—, però et dóna un nivell de control que les eines automàtiques no poden replicar. Un cop estiguis còmode amb aquestes eines, pots rescatar àudio que pensaves que era inúsable i assegurar que cada vídeo que produeixis tingui aquell so polit i professional.

Finalitza el teu vídeo amb nou àudio

A person's hand operates an audio mixer at a professional music production workstation with an iMac displaying 'FINAL MIX'.

Així que has eliminat amb èxit la música antiga. És una gran victòria, però el treball no ha acabat del tot. Ara et queda una pista vocal neta, que és el llenç en blanc perfecte per construir un paisatge sonor professional des de zero.

El següent pas més obvi és superposar música de fons nova. Però no pots simplement deixar caure l'èxit pop més recent: això és una manera segura de rebre una reclamació de copyright. Per estar al clar, has d'utilitzar música sense royalties. Són pistes específicament llicenciades per al teu tipus de contingut, ja sigui mitjançant una compra única o una subscripció.

Troba la banda sonora adequada

Tria la pista adequada va més enllà de trobar alguna cosa que t'agradi. La música ha d'ajustar-se a l'ànim del vídeo i, igual d'important, a la identitat de la teva marca. Ha de donar suport al teu missatge, no distraure'n. Estàs llançant un producte fitness d'alta energia? Voltaràs alguna cosa animada. Estàs explicant un tema complex? Una pista subtil i atmosfèrica probablement s'ajusta millor.

Aquí tens els meus llocs preferits per trobar música d'alta qualitat i legalment segura:

  • Serveis de subscripció: Per a qualsevol que crea contingut regularment, plataformes com Epidemic Sound o Artlist són salvavides. Una quota mensual et dóna accés il·limitat a biblioteques massives, fent que tot el procés de llicències sigui una brisa.
  • Mercats per pista: Si només necessites música per a un projecte únic i important, un mercat com PremiumBeat és una opció fantàstica. Pots comprar una llicència per a una pista específica perfecta per a les teves necessitats.
  • Arxius gratuïts (però bons): No ignoris la YouTube Audio Library. Té una col·lecció sorprenentment sòlida de música i efectes sonors completament gratuïts. Pot requerir una mica de cerca per trobar una joia, però és un gran punt de partida si tens pressupost ajustat.

Mescla el teu àudio per un so professional

Un cop hagis trobat la pista perfecta, és hora de mesclar-la amb el teu diàleg original. Aquí és on molts creadors es trenquen. L'error d'aficionat més gran és mesclar la música massa alta, obligant l'audiència a esforçar-se per sentir el que es diu.

Com a regla general, la música de fons per a vídeos amb molt diàleg hauria de mesclar-se a uns -18 dB a -24 dB en relació als nivells de diàleg. Això la manté present per establir l'ànim però prou baixa per romandre al fons on pertoca.

El procés és senzill. Importa la teva pista vocal neta i el teu fitxer de música nou al teu editor de vídeo i col·loca'ls en pistes d'àudio separades. Ara, prem reproducció i escolta de prop. Baixa el fader de volum de la música fins que quedi còmodament sota la parla sense competir-hi mai.

Per a una mescla encara més neta, busca una funció anomenada audio ducking. La majoria d'editors moderns la tenen, i és un canvi de joc. Baixa automàticament el volum de la música quan algú comença a parlar i l'eleva de nou durant les pauses.

És clar, algunes eines poden gestionar tot aquest flux de treball en un sol pas, des d'eliminar la música original fins a afegir una banda sonora nova i fins i tot generar un voiceover fresc. Si vols optimitzar encara més el teu procés, pots explorar com crear vídeo a partir de text i afegir elements d'àudio polits tot en un lloc. Dominar aquests tocs finals d'àudio és el que separa un vídeo bo d'un genial.

Preguntes habituals sobre eliminar música de vídeos

Tot i haver après els rudiments de la separació d'àudio, algunes preguntes solen aparèixer. Anem a respondre les més comunes que sentim dels creadors perquè puguis editar el teu contingut amb confiança total.

Endinsar-se en l'edició d'àudio és un canvi de joc, però és intel·ligent aclarir els detalls tècnics i legals. Aquí aclarirem qualsevol confusió.

Aquesta és grossa, i la resposta depèn realment de qui és el propietari del vídeo. Si elimines música amb copyright d'un vídeo que has gravat tu mateix —per exemple, per desfer-te d'una pista de fons que ha provocat una reclamació de copyright a YouTube o Instagram—, estàs al clar. És el teu contingut visual, i tens tot el dret a canviar l'àudio.

Els problemes comencen quan agafes el vídeo d'algú altre, elimines l'àudio i utilitzes les imatges per al teu propi contingut. Encara que l'original sonori desaparegui, podries estar infranent el seu copyright pel material visual en si.

La regla d'or és editar només vídeo que hagis gravat tu o material que hagis llicenciat adequadament. És l'única manera d'estar 100% segur que no violis el copyright.

Com de bo és l'AI per eliminar música?

Les eines d'AI modernes són sorprenentment efectives, però no són màgia. La qualitat del resultat final depèn realment de la mescla d'àudio original. Si les veus i la música estan enredades en el mateix rang de freqüències, o si la pista està xopa de reverb, pots sentir algunes imperfeccions lleus, sovint anomenades "artifacts", a l'àudio separat.

Per a la majoria de creadors que fan contingut per a xarxes socials o plataformes en línia, els resultats són més que bons. El meu millor consell? Escolta sempre l'àudio aïllat amb uns bons auriculars abans de publicar. És una comprovació ràpida que et pot estalviar molts maldecaps.

Quina és la diferència entre mutar i separar l'àudio?

Entendre aquesta distinció és clau per triar l'eina adequada per al treball.

  • Mutar és exactament el que sembla. És un instrument contundent que elimina la pista d'àudio sencera, deixant el teu vídeo completament silenciós.

  • Separació d'àudio, de vegades anomenada stem splitting, és un procés molt més sofisticat. Utilitza AI per identificar intel·ligentment elements diferents —com veus, música i efectes sonors— i et permet eliminar només la música mantenint el diàleg intacte.

Pensa-ho així: mutar et dóna un clip silenciós. La separació et dóna una pista vocal neta que pots utilitzar de veritat.


Llist per dedicar menys temps preocupant-te per l'àudio i més temps creant? ShortGenius integra l'escriptura de guions amb AI, creació de vídeo, voiceovers i programació en una plataforma intuïtiva. Recupera el control del teu flux de treball i veu com pots produir vídeos de qualitat professional en minuts visitant https://shortgenius.com.

Com treure la música d'un vídeo - Mantén les vocals el 2026 | Blog de ShortGenius