Script pre zoradenie a spocitanie slovicok v titulkach

Sekcia: Programovanie 13.11.2009 | 16:45
Avatar dit k/u/buntu_64  Používateľ
Dobry den.

Napise mi niekto script ktory by anglicke .srt titulky k filmu vyexportoval do suboru, a v nom by boli pod sebou slovicka zoradene a vedla pocet kolko krat sa v texte danne slovicko vyskytuje?


Dakujem
    • Re: Script pre zoradenie a spocitanie slovicok v titulkach 13.11.2009 | 18:51
      Avatar Zefram Cochrane MS Windows Vista Ultimate 64bi  Používateľ
      • Re: Script pre zoradenie a spocitanie slovicok v titulkach 13.11.2009 | 21:39
        Avatar dit k/u/buntu_64  Používateľ
        cauko,

        diky moc, ale vypise mi:
        dit@dit-desktop:~/Desktop$ ./titulky film.srt
        sed: -e expression #1, char 53: Invalid range end
        a vytvori mi prazdny film.srt.stat
        cize problem je v tom riadku co je sed, ked tam odstranim [ ] tak to ako tak ide ale dava mi tam cisla, slovicka opakuje tolko kolko krat su tam, pomlcky.... nevies kde moze byt chyba?
        • Re: Script pre zoradenie a spocitanie slovicok v titulkach 13.11.2009 | 21:55
          Avatar Zefram Cochrane MS Windows Vista Ultimate 64bi  Používateľ
          Toto ti funguje?

          echo asdf | sed 's/<i>//g;s/<\/i>//g;s/[ ,.\*\(\)\"0123456789-\/]/\n/g'

          Na konci riadku je \, za nim nesmie byt medzera, skusil som to skopirovat a mne to ide. Pripadne to skus skopirovat odtialto (le tam odkaz "download"):
          http://pastebin.com/pastebin.php?dl=m18424426
          Asi si to len nejak zle skopiroval
          • Re: Script pre zoradenie a spocitanie slovicok v titulkach 13.11.2009 | 21:57
            Avatar Zefram Cochrane MS Windows Vista Ultimate 64bi  Používateľ
            pastebin dava windowsacke konce riadkov takze po stiahnuti sprav dos2unix skript.sh
            • Re: Script pre zoradenie a spocitanie slovicok v titulkach 13.11.2009 | 22:28
              Avatar dit k/u/buntu_64  Používateľ
              stale to iste vypisuje, prosim pridi na to :(, btw to file_in_cp1250_dos_eol.srt to musim menit ci naco to tam je?
              • Re: Script pre zoradenie a spocitanie slovicok v titulkach 13.11.2009 | 23:01
                Avatar Zefram Cochrane MS Windows Vista Ultimate 64bi  Používateľ
                to je navod ako to pouzivat, to je akoze vstupny subor v CP1250 s dosackymi koncami riadkov
              • Re: Script pre zoradenie a spocitanie slovicok v titulkach 13.11.2009 | 23:05
                Avatar Zefram Cochrane MS Windows Vista Ultimate 64bi  Používateľ
                1. Toto ti ako funguje?: echo asdf | sed 's/<i>//g;s/<\/i>//g;s/[ ,.\*\(\)\"0123456789-\/]/\n/g'
                2. Aky je MD5 sucet toho skriptu ked ho stiahnes a ulozis na disk?
                3. Co vypise: sed --version
                4. Spustas to takto?: ./skript.sh nejaketitulky.srt
                • Re: Script pre zoradenie a spocitanie slovicok v titulkach 13.11.2009 | 23:49
                  Avatar dit k/u/buntu_64  Používateľ
                  myslis ze 9.riadok dam takto?:
                  xxxxxxxxxxxxxxxx6789-\/]/\n/g' | \

                  to iste vypise
                  $ md5sum m18424426.sh
                  4b9a9f8e669c2c58512f9a88534b63c4 m18424426.sh
                  $ chmod +x m18424426.sh
                  $ ./m18424426.sh Fast\ \&\ Furious.srt
                  bash: ./m18424426.sh: /bin/bash^M: bad interpreter: No such file or directory
                  $ dos2unix m18424426.sh
                  $ ./m18424426.sh Fast\ \&\ Furious.srt
                  sed: -e expression #1, char 53: Invalid range end
                  $

                  GNU sed version 4.2.1

                  jj spustam to tak
                  • Re: Script pre zoradenie a spocitanie slovicok v titulkach 14.11.2009 | 00:06
                    Avatar Zefram Cochrane MS Windows Vista Ultimate 64bi  Používateľ
                    1. Toto ti v terminali ako funguje?: echo asdf | sed 's/<i>//g;s/<\/i>//g;s/[ ,.\*\(\)\"0123456789-\/]/\n/g'
                    • Re: Script pre zoradenie a spocitanie slovicok v titulkach 14.11.2009 | 00:14
                      Avatar dit k/u/buntu_64  Používateľ
                      vypise sed: -e expression #1, char 53: Invalid range end
                      • Re: Script pre zoradenie a spocitanie slovicok v titulkach 14.11.2009 | 00:33
                        Avatar Zefram Cochrane MS Windows Vista Ultimate 64bi  Používateľ
                        skus v tom sede pred [ a pred ] dat \

                        echo asdf | sed 's/<i>//g;s/<\/i>//g;s/\[ ,.\*\(\)\"0123456789-\/\]/\n/g'

                        pripadne ak nie tak aj pred bodku co tam je
                        • Re: Script pre zoradenie a spocitanie slovicok v titulkach 14.11.2009 | 01:01
                          Avatar dit k/u/buntu_64  Používateľ
                          no uz to s tym nebrobi, ale vystup je aj tak zly: vystup(rapidshare.com) zas tam vypise namiesto jedneho slovicka ho tam opakuje tolko krat kolko krat tam je
                          • Re: Script pre zoradenie a spocitanie slovicok v titulkach 14.11.2009 | 01:09
                            Avatar Zefram Cochrane MS Windows Vista Ultimate 64bi  Používateľ
                            mas nainstalovane cstocs a perl?
                            • Re: Script pre zoradenie a spocitanie slovicok v titulkach 14.11.2009 | 01:23
                              Avatar dit k/u/buntu_64  Používateľ
                              mam:

                              This is perl, v5.10.0 built for x86_64-linux-gnu-thread-multi
                              This is cstocs version 3.4.