1. Tämä sivusto käyttää keksejä (cookie). Jatkamalla sivuston käyttämistä hyväksyt keksien käyttämisen. Lue lisää.

YLEn tekstitykset tallentuvat suhruisina

Viestiketju Digivideo-ongelmat ja -keskustelu -osiossa. Ketjun avasi Frohike 17.06.2012.

  1. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Mistähän mahtaa kiikastaa, kun YLEn kanavilta digitaalisesti tallennettujen lähetysten tekstitysraidat ovat lähes lukukelvottoman suhruisia?

    Tallennan siis digitv-kortilla kovalevylle lähetyksiä mpg-muodossa. Tämän demuxaan ProjectX:llä ja authoroin IfoEditillä. Lopuksi yritän vaihtaa vihreän tekstityksen DVDSubEditillä.

    Viimeisen kuukauden ajan ollut kaikissa tekstitetyissä tallenteissa sama vika. Kirjainten reunat ovat muuttuneet repaleisiksi ja ovat liian kiinni toisissaan koska jostain syystä niissä on aivan järjettömän paksu lihavointi päällä.

    Lisäksi kun sitten muutan tekstitystä valkomustaksi niin vaikka annnan komennon Apply changes to all... niin silti joihinkin väleihin jää tekstityksiä joihin muutokset eivät päde.

    Koskaan aikaisemmin ei ole ollut moista ongelmaa. Tulisko mitään vinkkiä mieleen, mistä ongelma juontaa juurensa? Voisi hyvinkin olla syynä YLE itse, koska siellä nyt kaikki muutetaan ja uudistetaan, niin mikseipä tekstitysraidatkin voitaisi pilata samalla. ;)
     
  2.  
  3. 1pertti

    1pertti Senior member

    Liittynyt:
    10.09.2008
    Viestejä:
    9,093
    Kiitokset:
    1,208
    Pisteet:
    243
  4. verovanki

    verovanki Regular member

    Liittynyt:
    15.08.2007
    Viestejä:
    594
    Kiitokset:
    86
    Pisteet:
    38
  5. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Tein kaiken niinkuin ennenkin, mutta koitin lopuksi siis ripata tekstityksen irti valmiista VOB-tiedostosta SubRipin avulla.

    SubRip alkoi näyttää ruudulla niitä tekstityksen kirjainkuvia ja kysyi mikä kirjain tämä on, ja sitten näppäilin näppäimistöltä aina oikeaa kirjainta.

    Ohjelma ei vain kysy jokaista kirjainta kerran, vaan se kysyy jokaisen tekstityksessä olevan merkin. Näin ollen... montakohan merkkiä mahtaa yksi tekstitysraita sisältää... ainakin satoja tuhansia ellei miljoonia... Ihan tämän tasoiseen harrastukseen ei enää kiinnostus riitä. Mun SubRip-versioni on 1,50b4.

    Kuuluisiko SubRipin tajuta niitä repaleisia ylen sontafontteja ilman manuaalista kirjaintunnistusta?
     
  6. pentsu

    pentsu Active member

    Liittynyt:
    07.03.2008
    Viestejä:
    1,388
    Kiitokset:
    24
    Pisteet:
    68
    Ei kuulu ymmärtää. Teet pilkun tarkasti tuon TEME565:n ohjeen mukaan, jonka verovanki linkitti. Sillä ainakin itse olen onnistunut. Sen jälkeen subripin läpivienti kestää n. 5 minuuttia.
     
  7. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Juu, olen tehnyt pilkulleen juuri niinkuin ohjeessa sanotaan.

    Toi ohje on tehty ennen tämän kevään YLE:n tekstitysuudistusta. Eihän tässä ongelmaa olisikaan, jos SubRip kysyisi vaan kerran kutakin kirjainta. Ei Suomen kielessä niin montaa aakkosta ole kuitenkaan. Mutta kun nyt nuo puuroutuneet rosoreunaiset uudet tekstityskirjaimet eivät ole identtisiä. Näin ollen SubRip kysyy esim. jokaisesta tekstitysraidassa olevasta a-kirjaimesta erikseen, koska ne eivät ole jostain syystä identtisesti puuroutuneita ja rosoisia.

    Olen tehnyt tämän vaiheen SubRipillä onnistuneesti aikana, jolloin ei ollut tätä uutta kunkin kirjainyksilön kohdalta uniikilla tavalla puuroutuvaa fonttia.
     
    Viimeksi muokattu: 18.06.2012
  8. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Puoli tuntia olen jo ehtinyt tehdä kuva-arvausleikkiä... silmiä särkee ja edistymä on vasta 40%. Lisäksi merkittävä osa "kuva-arvoituksista" on niin suhruisia ja vaikeaselkoisia, että olen melko varmasti tulkinnut ne vääriksi kirjaimiksi. Ja sen jälkeenhän tekstityksestä syntyy siansaksaa...
     
  9. vinikka

    vinikka Regular member

    Liittynyt:
    04.05.2008
    Viestejä:
    313
    Kiitokset:
    1
    Pisteet:
    28
    Demuxsaappa ne projext x:llä NRK muodossa. Ja vobsubin subresyncillä veät ne SRT muotoon. Ylen kanavilla on kyllä yleensä tekstitys myös Teletext:tinä vaikka ne ei näkyisi projektx:llä pistät vaan oikian teletext sivun siihen projekt:xään. Ainaki sateliitti puolella ne tallentuu kaikki matkaan kun TS filuna tallentaa jotain YLEN kanavilta. Ja ne ei näy siinä projext:xllä vaikka ne on siellä tallenteessa.
     
  10. verovanki

    verovanki Regular member

    Liittynyt:
    15.08.2007
    Viestejä:
    594
    Kiitokset:
    86
    Pisteet:
    38
    Yksi konsti on vaihtaa ifo-edit muxman: iin. Muxman tekee samat asiat nopeammin. Tosin sillä tekstit on punareunaisia. Subrip tunnistaa kyllä varmasti ne paremmin. Koetanpa etsiä project-x:n sopivat värit ettei tarvitse tehdä turhaa työtä :)
    tv1 451
    tv2 452
    teema 453
    yle fem 771
     
    Viimeksi muokattu: 19.06.2012
  11. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Minun digitv-korttini tallentaa antenniverkon lähetyksiä. Tuo NRK on ymmärtääkseni tosiaan satelliittipuolen juttuja. Koitin toki sitäkin, muttei se tuonut mitään näkyvää muutosta mihinkään.

    Authoroin m2v, mp2 ja sup-tiedostot tällä kertaa MuxManilla, mutta saan joka kerta lopuksi saman ilmoituksen: "Multiplex operation halted: Largest GOP of 36 fields exceeds DVD specification of 30. Resulting DVD is non-standard."

    MuxMan saa tästä huolimatta VIDEO_TS -kansioon tehtyä valmiin tuotoksen. Jostain syystä MuxManin jäljiltä tekstitysten reunus on vaihtelevasti mm. valkoinen, violetti, vihreä, harmaa, keltainen, turkoosi, ruskea ja punainen... Ei oikein kahta samanlaista väriä tule vastaan - eikä ainakaan peräkkäin.

    Kokeilin noita antamiasi YLEn värikoodeja. Testitallenteeni on otettu YLE Teemalta, mutta kun asetin "fix to pageID" -kohtaan Teeman luvun 453, niin ProjectX demuxasi enää vain ääni- ja kuvaraidan.

    Kokeiltu on myös VobSubin SubResync-toimintoa. Se on huomattavasti parempi, koska näyttää tekstityksen samalla kokonaisena, ettei tarvitse arvailla merkkejä sanayhteyksistään irroitettuna kuten IfoEditin+SubRipin kanssa. Siitä huolimatta viiden minuutin testailun aikana olin saanut eteeni jo lukuisia kertoja samoja kirjaimia. Eli edelleenkin ne kirjainkuvat ovat yksilöitä ja niitä ei voi "massatunnistaa" kerralla. :/

    SubRip tosiaan esikatseluttaa tekstiä paremmin MuxManin jäljiltä kuin IfoEditin jäljiltä. Nyt se jopa näyttää sanoja samalla, kun kysyy siinä olevia kirjaimia. IfoEditin jäljiltä ei tosiaan näytetty sanaa vaan pelkkää yksittäistä kirjainta. Kuitenkaan MuxManinkaan kyvyt eivät riitä siihen, että kirjaintunnistuksesta tulisi jouhevampaa SubRipissä. Edelleenkin kysytään lähes jokainen merkki uudestaan. Eli kyseessä olisi jälleen tuntien/päivien tunnistusurakka.

    (YLE on kyllä hieno firma. Se rasittaa jokaista Suomen kansalaista - katsoipa/kuuntelipa sen kanavia tai ei. Ja hankaloittaa varsinkin tallennekeräilijöiden harrastuksia, kuten minun tapauksessani. Tietty voisin heittää digikorttini seinään ja alkaa ostamaan kaiken kaupallisina dvd-levyinä... mutta kun esim. Teema esittää juuri sellaisia tallenteita joita ei välttämättä ole tarjolla missään muualla. "Me on hävitty tää peli.")
     
    Viimeksi muokattu: 19.06.2012
  12. vinikka

    vinikka Regular member

    Liittynyt:
    04.05.2008
    Viestejä:
    313
    Kiitokset:
    1
    Pisteet:
    28
    Siis demuxsaa ensin NRK:na ulos ne sup filut. Käytä sitten VobSubin SubResync softaa kun muutat ne SRT:ksi, sillä ite mitä olen testaillu niin tuo NRK on lähimpänä oikiaa sillä on näköjään vaikutusta miten ne sup filut irrottaa tallenteesta.
     
  13. pentsu

    pentsu Active member

    Liittynyt:
    07.03.2008
    Viestejä:
    1,388
    Kiitokset:
    24
    Pisteet:
    68
    Avasithan varmasti sen ifon (open IFO) siihen subripiin? Ilman sitä nimittäin on suttua.
     
    Viimeksi muokattu: 19.06.2012
  14. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Demuxasin MPG-tallenteesta NRK:na ulos SUP-tekstityksen. Sitten latasin sen VobSubin SubResynciin ja tallensin SRT:nä. SubResync kysyy lähes jokaista merkkiä. Eli käytännössä joudun tunnistamaan vaikkapa 50000 a-kirjaimen kuvaa a-kirjaimeksi 50000 kertaa. Edelleenkin ovat kaikki kirjainkuvat liian yksilöllisen näköisiä.
     
  15. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Kun valitsen open ifo, niin se lataa samalla automaattisesti ne VOB-tiedostot alla olevaan vob-listaan. Ei vaikuta mihinkään mulla toi toimenpide, ihan yhtä vaivalloisesti tunnistuu kirjaimet.
     
  16. verovanki

    verovanki Regular member

    Liittynyt:
    15.08.2007
    Viestejä:
    594
    Kiitokset:
    86
    Pisteet:
    38
    dvdauthorgui tekee kerralla dvd:n, tosin tekstien paikat on default asetuksilla aika keskellä kuvaa.
    http://download.videohelp.com/liquid217/dvdauthorgui.pl?p=download
    Huom: vista ja win 7 suorita järjestelmänvalvojana

    http://fi.wikibooks.org/wiki/Topfield_TF5X00/DVDn_Poltto

    Valitse "add title"
    Mene kansioon, jossa on dvb tiedostot ja valitse ainoa tiedosto minkä voi valita
    Valitse tämän jälkeen ainoa äänitiedosto
    Valitse extras valikosta "add/edit subtitles"
    Paina "add subtitle" nappia ja valitse tiedostotyypiksi sup-pääte, jolloin oikea tiedosto löytyy.
    Valitse väreiksi 000000, 707070 ja FCFCFC
     
  17. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Toimein näin ja tuloksena syntyi tähän mennessä paras versio. Tekstitystä pystyy jo lukemaan.

    Noin joka toinen tekstitysraita on harmaamusta ja joka toinen valkomusta. Edelleenkin kirjaimet ovat hiukan rosoisia ja etenkin niiden väritäyttö on täynnä pikselisuttua. Ei siis puhtaan valkoisia kirjaimia, eikä puhtaan harmaitakaan vaan pilkullisia kirjaimia pikemminkin. Kuitenkaan kirjaimet eivät ole enää lihavoituina ja paisuneina toisiinsa kiinni, mikä helpottaa lukemista.

    Koitin huvikseni lopuksi SubRipillä muuntaa valmiin DVDAuthorGUI:n tuotoksen SUP-raidan SRT-tekstitykseksi. Mutta SubRip ei ymmärrä sitä sen paremmin kuin ennenkään. Lähes joka kirjain on yksilöllinen.
     
  18. vinikka

    vinikka Regular member

    Liittynyt:
    04.05.2008
    Viestejä:
    313
    Kiitokset:
    1
    Pisteet:
    28
    Tallennappa kokeeksi vaikka YLE1 ja demuxsaa srt:nä tekstit teksti:tn sivulta 333 sateliitiissa ainaki on kyseisellä sivulla suomisubit.

    YLE2 sivulla 452

    Päivitän loput sitten ko kanavilta tulee ohjelmaa jossa on tekstit.
     
    Viimeksi muokattu: 26.06.2012
  19. Frohike

    Frohike Regular member

    Liittynyt:
    27.09.2005
    Viestejä:
    158
    Kiitokset:
    0
    Pisteet:
    26
    Tallensin nyt kokeeksi pätkän satunnaista lähetystä YLE TV2:desta. Asetin värimalliksi YLE ja pageid:ksi 452. Edelleenkin käy samoin kuin aiemmin, eli yhtään tekstitystä ei ProjectX:llä demuxatessa synny.

    Tässä ProjectX:n tapahtumalokin loppuosa tekstitysten osalta:

    Ylehän käyttää nykyään sitä Tiresias-fonttia, niin kannattaisiko ProjectX:n Subtitle-vlilehdestä valita ilmeisesti oletuksena valittuna olevan Tahoman tilalle TiresiasScreenfont? En kyllä ole huomannut mitään eroa missään. Kaipa se johtuu siitä että SUP on tosiaan kuvia kirjaimista eikä varsinaista tekstiä...
     
    Viimeksi muokattu: 26.06.2012
  20. verovanki

    verovanki Regular member

    Liittynyt:
    15.08.2007
    Viestejä:
    594
    Kiitokset:
    86
    Pisteet:
    38
    Hyvä että laitoit ton lokin, jätä pois fixed to page id kohta project-x ssä
    sitten saat tekstit ulos srt nä.
    Laitan omasta kokeilusta osan lokista:
    ++> Teletext: PID 0x1388 / PesID 0xBD / SubID 0x10 :

    -> export format: srt
    -> decode hidden rows of teletext (id 0xFF, means offline pages)
    -> keep original Timecode (PTS) on independent decoding
    -> temp. file: Monk-13.tt (65297644 bytes)
    -> looking for page number 451
    -> Teletext PTS: first packet 04:14:44.802, last packet 04:55:59.970
    -> Video PTS: start 1.GOP 04:14:45.618, end last GOP 04:56:00.418
    ->adjusting teletext at video-timeline
    -> program: YLE
    529 pages of No. 451 written...
    ---> new File: E:\digiboksista\monkit\Monk-13[451].srt


    Voin tarvittaessa laittaa oman project-x .ini tiedoston tänne jos siitä on apua jollekin.
     
  21. verovanki

    verovanki Regular member

    Liittynyt:
    15.08.2007
    Viestejä:
    594
    Kiitokset:
    86
    Pisteet:
    38
    tossa on mun x.ini tiedosto



    # Project-X INI
    # ProjectX 0.91.00.02 / 14.08.2011

    # Application
    Application.ActiveDirectory=E:\digiboksista\
    Application.Agreement=1
    Application.Language=en

    # CollectionPanel
    CollectionPanel.CutMode=0

    # MainPanel
    MainPanel.ConversionMode=0

    # SubtitlePanel
    SubtitlePanel.ChangeDisplay=1
    SubtitlePanel.PageId.Value=
    SubtitlePanel.SubpictureColorModel=(0) 4 colours
    SubtitlePanel.SubtitleExportFormat=SRT
    SubtitlePanel.SubtitleExportFormat_2=SUP
    SubtitlePanel.TtxPage1=451
    SubtitlePanel.TtxPage2=452
    SubtitlePanel.TtxPage3=453
    SubtitlePanel.decodeHiddenRows=1
    SubtitlePanel.exportAsVobSub=1
    SubtitlePanel.keepOriginalTimecode=1
    SubtitlePanel.rebuildPTS=1
    SubtitlePanel.rebuildPictPTS=1
    SubtitlePanel.useTextOutline=0

    # WindowPosition
    WindowPosition.Main.Height=632
    WindowPosition.Main.Width=852
    WindowPosition.Main.X=50
    WindowPosition.Main.Y=50
     

Jaa tämä sivu