Tekstien lukemisen vaikeus

Viestiketju Digivideo-ongelmat ja -keskustelu -osiossa. Ketjun avasi PETE11 15.03.2013.

  1. PETE11

    PETE11 Regular member

    Liittynyt:
    22.10.2006
    Viestejä:
    791
    Kiitokset:
    8
    Pisteet:
    28
    Moikka...

    Mistä johtuu, kun poltan tekstit kiinni, niin lopputuloksena tulee melkoista harakanhyppelyä nuo tekstit. Osaksi tosi vaikea lukea. Esim. poltan kiinni tekstit tuolla "Any Video Converter" ohjelmalla ja tekstit ovat SRT muodossa.
     
  2.  
  3. teme565

    teme565 Active member

    Liittynyt:
    10.05.2002
    Viestejä:
    3,306
    Kiitokset:
    0
    Pisteet:
    66
    olisko screenshottia laittaa? Itellä lähinnä tulee mieleen, että jos videon resoluutio on kovin alhainen, siihen polttaa tekstit ja sitten kattoo fullscreenillä, niin ei se hyvältä näytä.
     
  4. PETE11

    PETE11 Regular member

    Liittynyt:
    22.10.2006
    Viestejä:
    791
    Kiitokset:
    8
    Pisteet:
    28
    Tässä eräästä elokuvasta teksti tiedosto... Elokuva "Miehet varjoista":

    [​IMG]

    En jaksa kaikkia muuttaa tai korjata jokaista kohtaa käsin.Se kyllä onnistuu..Mutta hirveä homma. Elokuvat on suurimmalti osalta 1280 x 720 HD

    Jos tämän liittää elokuvaan irtoliitteenä niin tekstin lukemisessa ei mitään ongelmaa. Kuitenkin kun yrittää kiinittää tätä tiedostoa elokuvaan,niin teksti näkyy elokuvassa samanlaisessa muodossa kuin tuossa ylhäällä tekstimuistiossa. Melkoista harakanhyppelyä...
     
    Viimeksi muokattu: 15.03.2013
  5. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    Varmista että koneellasi on Subtitle Workshop ohjelma, löytyy Afterdawn sivulta.

    kuva1
    http://aijaa.com/x7D1em
    tässä näet miltä alkuperäinen teksti näytti, kun se avattiin subtitle workshop ohjelmassa:

    kuva 2
    http://aijaa.com/V5YIkh
    avaa alkuperäinen teksti muistio ohjelmalla ja kopioi tekstitys leikepöydälle muistiin

    kuva 3
    http://aijaa.com/1RYNx9
    avaa Subtitle Workshop ohjelma uudestaan ja aloita uuden tiedoston tekeminen. Liitä kopioitu teksti kuvassa olevaan paikkaan.

    kuva 4
    http://aijaa.com/xvFB1C
    ohje tallennuksesta

    kuva 5
    http://aijaa.com/14hSil
    tallennusohje jatkuu, mm. tallennusmuoto (srt)

    kuva 6
    http://aijaa.com/5nWMkv
    (anna uudelle tekstille nimi ja tallennuspaikka)

    kuva 7
    http://aijaa.com/hy4Pje
    uusi korjattu teksti avattuna Subtitle Workshop ohjelmassa, nyt kaikki kirjaimet on oikein.
     
  6. xbkrypt0n

    xbkrypt0n Active member

    Liittynyt:
    16.06.2010
    Viestejä:
    3,154
    Kiitokset:
    120
    Pisteet:
    73
    Et tarvitse subtitle workshoppia mihinkään tuossa hommassa. Kopioi siellä muistiossa merkkijono joka ei ole oikein (esim. Ão) ja paina CTRL+R (Muokkaa -> Korvaa...) ja pistä korvattavan merkkijonon kohdalle se väärä merkkijono ja korvaavaksi merkkijonoksi oikea kirjain (esim. ä) ja paina Korvaa Kaikki. Nuo oudot merkit johtuvat siitä, että tekstitiedosto on muuten ASCII muodossa, mutta ääkköset ovat jostain syystä UTF-8 -muodossa. Normaalisti kaiken tekstin tulee olla samassa muodossa, mutta jotkut softat jostain syystä säätävät omiaan (esim. osa tekstistä ASCII-koodattua, osa UTF-8) ja tekstieditorit eivät oikein tiedä miten teksti pitäisi näyttää käyttäjälle.
     
  7. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    okei, ihan hyvä, mutta eikö ohjeessasi pidä kuitenkin tarkistaa mikä kirjain on väärin ja sitten antaa korvaava merkki. Tekemässäni ohjeessa ei tarvitse tarkistaa tekstitys rivejä lainkaan, eikä tarvitse metsästää tiettyä virhettä, subtitle workshop korjaa ne automaattisesti oikein.
     
  8. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    sellainen pointti vielä, että muistio ohjelmassa alkuperäinenkin teksti näkyy ihan oikein ääkköset mukana, mutta kun aukaisee tuolla subtitle ohjelmalla virheet näkyvät. Tekstieditorilla ei siis voi korjata kun virheet ei siinä näy.
     
  9. xbkrypt0n

    xbkrypt0n Active member

    Liittynyt:
    16.06.2010
    Viestejä:
    3,154
    Kiitokset:
    120
    Pisteet:
    73
    Pitää toki tarkistaa, mutta ei luulisi kovin vaikea homma olevan olettaen, että kieli on suomi. Suomenkielessä on aika runsaasti ääkkösiä. Mikäli kyseessä olisi jokin eksoottisempi kieli tai merkkejä ei olisi kuin tyyliin muutama monessa tuhannessa rivissä tekstiä, voisi erillisen softan asennuksessa olla jotain järkeä.

    Kuvassa tekstitystiedosto on avattuna muistiolla joka on tekstieditori ja siinä virheet näkyvät. Omasta mielestäni tuo ei ainakaan ihan normaalilta näytä. Subtitle Workshop voitaisiin myös luokitella tekstieditoriksi. Syy miksi se tuolta näyttää näkyy aiemmin lähettämässäni viestissä. Tällöin on todennäköistä että tekstitystiedosto näkyy väärin myös muilla ohjelmilla, kuten subtitle workshopilla. Lisäksi mikäli tuon avaa muistiolla (eli notepadilla) ja se näkyy oikein, voi koodauksen muuttaa todella helposti ANSI-koodaukseen tallennuksen yhteydessä, eli Tiedosto -> Tallenna nimellä... -> Koodaus-pudotuslistalta valitsee halutun koodauksen.

    Sekoitin näemmä ANSI:n ja ASCII:n keskenään tuossa aiemmin.
     
    Viimeksi muokattu: 16.03.2013
  10. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    Hyvä! Ongelmiin löytyy monesti monta ratkaisua ja jokainen tekee hiukan eri tyylillä. Se miten kukin itse haluaa sen tehdä on varmasti "ihan hyvä" jos se kerran toimii. Mukavia tekstitys "hetkiä" kaikille :)
     
  11. xbkrypt0n

    xbkrypt0n Active member

    Liittynyt:
    16.06.2010
    Viestejä:
    3,154
    Kiitokset:
    120
    Pisteet:
    73
    Kerkesit sitten vastaamaan, joten siirrän editointini tähän viestiin.

    Pienen selvittelyn jälkeen. Tuo muistiossa UTF-8 -koodauksella väärin näkyvä teksti johtuu double-encoded UTF-8 -tekstistä, eli esim. ä kirjain on tällöin muotoa (ANSI-koodauksella tarkasteltuna):
    ä
    joka näkyy muistiossa kertaalleen UTF-8 dekoodattuna:
    ä

    http://en.wikipedia.org/wiki/UTF-8#Invalid_code_points

    Tuota virhettä EI voi korjata tuolla ohjeella jonka kirjoitit.

    EDIT (helpompi versio):
    Toinen vaihtoehto tuohon korvaa-neuvooni on tallentaa tiedosto nimellä ja valita ANSI-koodaus alhaalta. Tämän jälkeen sulje muistio ja avaa tekstitys uudelleen, tällöin muistio/notepad tunnistaa UTF-8 koodauksen automaattisesti ja näyttää merkit oikein. Sitten tallennat tiedoston vielä kertaalleen tallenna nimellä kautta ja tallennat sen jälleen ANSI-koodattuna.
     
    Viimeksi muokattu: 16.03.2013
  12. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    alkuperäinen teksti todellakin avuttu muistiolla ja näytti olevan fin loppuinen teksti. Todennäköisesti yle areenasta ladattu, niinkuin minunkin esimerkki tiedosto, koska sekin on fin loppuinen. Huomasitko minun esimerkissä alkuperäinen näkyi oikein muistiossa, ääkkösten kanssa. Onkohan kaveri muokannut jo alkuperäisestä jotenkin ja sitten avannut muistiossa. Se on totta että jos muistiossa näkyy nuo virheet menee vaikeammaksi. Itselläni ei ole koskaan ollut ongelmia muutoksen kanssa käyttäen subtitle workshoppia. Jos sinun ohje toimii niin, edelleen sama vastaus, sehän on silloin hyvä ohje. Minullakin toimii ja sekin on hyvä.
     
  13. xbkrypt0n

    xbkrypt0n Active member

    Liittynyt:
    16.06.2010
    Viestejä:
    3,154
    Kiitokset:
    120
    Pisteet:
    73
    Tupla UTF-8 koodaus on hyvin yleistä huonosti koodatuissa ohjelmissa. Noiden ylimääräisten UTF-koodauksien poistaminen taas voi olla tuskallista, varsinkin jos puhutaan joka tallennuskerralla syntyvästä UTF-koodauksesta, eli jossain tekstitiedostossa voi huonolla tuurilla olla vaikka 50-kertainen UTF-8 koodaus jonka dekoodauksessa voi hetki vierähtää :)
     
  14. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    Tunnut tietävän paljon noista koodauksista. Oletko muuten perehtynyt YLE-tekstityksiin joiden kanssa on paljon ongelmia nykyisin. Aikaisemminhan yle tekstit sai helposti projectx-ohjelmalla talteen ja sitten yhdistäminen sujui mallikkaasti ifoedit ohjelmalla. Sitten yle muutti fonttia...tai jotain muutakin, niin että projectx ei tee enää siistiä jälkeä. Epäselvä teksti ja virheitäkin enemmän. Kyllästyin tappeluun ja ostin kaupallisen ohjelman nimeltä TMPGENC authoring works5, joka osaa suoraan lukea tekstit yle ohjelmista. Olisi kuitenkin ollut kiinnostavaa ratkaista projectx ongelma.
     
  15. PETE11

    PETE11 Regular member

    Liittynyt:
    22.10.2006
    Viestejä:
    791
    Kiitokset:
    8
    Pisteet:
    28
    Tämä on muuten ladattu tuolta yle areenan sivulta, niin elokuva kuin tekstit..Mulla on käytössä myös subtitle workshop, mutten ole pystynyt korjaamaan sillä tuota ongelmaa. Liekö sitten en osaa tätä ohjelmaa käyttää. Kun lataan tällä teksit ja niin ne näkyy samanlaisena harakan hyppelynä..Tämäkin teksi näkyy olevan srt..Muutan sen vaikka Subrip...Niin ainakin muissa teksteissä ei muutosta ole parempaan tapahtunut...
     
  16. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    Laitan vielä tämän! Kun avaat ALKUPERÄISEN tiedoston muistiossa, varmista että avaat sen UTF-8 muodossa, muuten teksti ei välttämättä näy oikein. Sen jälkeen kopioi avattu teksti subtitle workshopiin ja tee niinkuin alussa neuvoin.

    http://aijaa.com/1n8rsR

    xbkrypt0nin ohje on myös hyvä, jos muuten ei onnistu

    t.Markku
     
  17. PETE11

    PETE11 Regular member

    Liittynyt:
    22.10.2006
    Viestejä:
    791
    Kiitokset:
    8
    Pisteet:
    28
    Miten avaan UTF-8 muodossa...En löydä sitä !!

    Löysin viimein..
     
    Viimeksi muokattu: 16.03.2013
  18. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    Ahaa, sulla on ilmeisesti vanhempi windows versio kuin minulla (win7). Vois löytyä kokeilemallakin, kun avaat tiedostoa muistiossa, katso mitä vaihtoehtoja tiedotomuodolle siellä on. Se muoto joka antaa selvän tekstin on sopiva tähän tarkoitukseen.
     
  19. PETE11

    PETE11 Regular member

    Liittynyt:
    22.10.2006
    Viestejä:
    791
    Kiitokset:
    8
    Pisteet:
    28
    Moikka...

    Kiitos ohjeistuksista kummallekkin...Sain tekstit kohdalleen tuon xbkrypt0n ohjeen mukaan.
    Eli se helpotti huomattavasti tämän tekstityksen korjaamista kohdalleen. Itselläni on myös tuo Subtitle Workshop, mutta tässähän ei tarvinnut sitä... Vielä jouduin lopussa tarkastamaan lauseet...Siinä oli hiemän pienet ä ja ö väärässä kohdissa. Tämä sen jälkeen kun olin Ä korvannut pienellä ä:llä.. Mielestäni tämä auttoi minua tässä asiassa paljon..

    Ongelma 2

    Olen taistellut tämän tekstityksen kanssa l. miten saan ja millä ohjelmalla poltan tekstit kiinni.. Virtual Dub:



    Samoin kuin olen kokeillut Any Video Converter ja AVI ReComp...
    Any Video C... Sain teksitykset näkymään yhden kerran, nyt kun yritän tätä yllä olevaa elokuvaa tekstien kera polttaa, en saa esille asetuksista tekstitiedostoa..Se on samassa kansiossa videotiedoston kanssa...Nyt käytössä on AVIDeMux ohjelma.. Tai olen sitä kokeillut tässä asiassa...Se ei hyväksy SRT tekstitiedostoa...Olen joutunut sen muuttamaan tuolla Subtitle Workshop ohjelmalla "Sub station Alpha" Se hyväksyy ssa ja ass tiedostot. Hyvä laatu, mutta tärkein eli tekstejä ei näy niin kuin muissakin ohjelmissa.

    Voi olla että vika on näytön ja penkin välissä. Olen melko untuvikko tässä asiassa...Irtotekstien lisäys elokuvaan ei tuota mitään vaikeutta.Ne näkyvät...
     
    Viimeksi muokattu: 19.03.2013
  20. xbkrypt0n

    xbkrypt0n Active member

    Liittynyt:
    16.06.2010
    Viestejä:
    3,154
    Kiitokset:
    120
    Pisteet:
    73
    YLE muutti tekstit tavallisesta TTX tekstityksestä DVB tekstitykseen, eli ne tekstit ovat nykyään kuvia (.SUP) EDIT: Ja nykyään nuo kuvat ovat lisäksi JPEG/tms. pakattuja, jolloin niihin tulee koodauksesta johtuvaa kohinaa joka näyttää ikävältä. BDSUP2SUB -softalla ja värien kanssa säätämällä muistaakseni sai tekstit sellaiseen muotoon, että niitä pystyi jotenkin käsittelemään jollain tekstirippaajalla... todennäköisesti SupRip tai SubRip softalla. Tämän jälkeen tekstit pitää yleensä vielä ajastaa kohdalleen. Vaatii todella paljon säätämistä ja aikaa. Toki jos riittää että melkein saa selvää, niin värejä säätämällä pelkkä .SUP näyttää tekstit ihan kohtuullisesti, ilman että sitä yrittää muuttaa käsin .SRT muotoon.

    Sen .SUP tiedoston saa videoon tungettua esim.
    AviSynth ohjelmalla ja .avs skriptillä
    AviSynthin plugins kansioon pitää laittaa x86 DirectVobSubista VSFilter.dll
    http://www.free-codecs.com/directvobsub_download.htm

    Esimerkkiskripti (tiedosto.avs):
    Koodi:
    DirectShowSource("Elokuva.avi")
    TextSub("Elokuva.srt")
    Tuon .avs tiedoston voi sitten avata vaikka VirtualDubMod tai VirtualDub ohjelmalla. Ääni kannattaa demuxata videosta virtualdubin streams listan demux napilla, koodata erikseen jollain ohjelmalla (MP3 CBR, ei toimi kovin hyvin VBR kanssa) ja sitten avata virtualdubilla streams listalle ja poistaa videon oma ääniraita käytöstä. Jos ääntä ei saa avattua suoraan koodaussoftalla, niin se pitää ensin käsitellä esim. Audacity for Windows ohjelmalla koska se on silloin raw pcm muodossa ja se pitää saada normaalin wave pcm muotoon. Tai sitten vaan virtualdubista yrittää suoraan save wav -napilla, mutta en ole 100% varma että toimii.
     
    Viimeksi muokattu: 19.03.2013
  21. termase22

    termase22 Member

    Liittynyt:
    31.08.2009
    Viestejä:
    28
    Kiitokset:
    0
    Pisteet:
    11
    Kiitos paljon vastauksesta! Huh kyllä Yle teki temput kun noin muutti tuon tekstityksen! Taidan jatkaa TMPGENC authoring worksin käyttöä, koska siinä ei tarvitse oikeastaan osata mitään :)
    Pidän kuitenkin arvossa ohjettasi, kiitos!
     

Jaa tämä sivu