На кое викаш текст на песен? Предполагам че говориш за вокалите. Има уж някои специализирани програми, които се опитват да правят това, но те са подходящи само донякъде за караоке, и резултата е глъхнеща песен, и немного добре изчистени вокали. Проблемът е че като се събере всичкият звук - сбирщината от синусоиди като се събере се получава една крива, която поне засега няма как да се раздели на съставните и части, а от там да махаш един или друг глас или инструмент. Попитай google за някакво решение, но такова което наистина да чисти вокалите, съм абсолютно сигурен че няма да намериш.
По същият начин седи въпроса и с конвертирането към midi формат. Този формат представлява последователността от тоновете (нотите) които трябва да изсвири всеки отделен инструмент, записани в отделни канали. Компютъра след това прочита всеки инструмент какво трябва да изсвири, генерира звука на базата на това на кой канал какви ноти има и с какъв инструмент да се свири и сбора от всичко това отива към тонколонките. За човека е долу-горе лесно да различи - това е цигулка и тя свири ето такава мелодия, а това е човек и той пее този и този текст. Но компютъра не може да разбере това на базата на сборната крива която той възпроизвежда. Единствен резултат може да се постигне с песен, в която свири един или най много два различни инструмента - тогава разлагането е възможно и става даже що-годе качествено.