Milujem curl

14.01.2014 | 01:56 | originalnynazovblogu | LUcoRP

zas mi raz dalsi vsemocny linuxovy nastroj zachranil pr*el.

Co by ste robili, v pripade ze mate stiahnut produktove obrazky k stovkam produktov a dementi na zdrojovom portali nie su schopni dat dohromady akykolvek feed, pripadne ftp pristup, ci iny rozumny sposob ziskania obrazkov? Prva odpoved - parser - prilis zdlhave kvoli bordelu co maju na stranke.

Nastastie mali chalani v ukladani obrazkov zachovany urcitu logiku ktora sa dala zneuzit aj na moje ucely. Obrazky boli ukladane v jednoduchej logike /standardna_cesta/[ID_produktu][kod_farby]_[nahodne_cislo_0-9].jpg.

Potom stacilo iba makrom stiahnut vsetky potrebne linky obrazkov, parserom z tych liniek vytiahnut ID produktov a nasledne z liniek a ID produktov vygenerovat curl prikazy pre stiahnutie aj neexistujucich suborov (kvoli nahodnemu cislu 0-9 na konci nazvu suboru). Curl nastastie na serveri neexistujuce subory obskocil a nezostal na nich visiet. Odhadovana uspora casu voci manualnej robote niekolko desiatok hodin.

Aby mal tento blog aspon aku-taku pridanu hodnotu. Prikaz curl vyzeral nejak takto:

curl http://cesta_k_obrazkom/[ID_aj_s_farbou]_[0-9].jpg --create-dirs -o /cesta_pre_ulozenie/[ID_produktu]/[kod_farby]-[0-9].jpg

Chudak admin serveru ked si najde v logu niekolko tisic dopytov zo slovenska a bude sa snazit prist co za skiddie sa mu prechadzalo pred branami. Tak ma napada existuju nejake standardizovane postupy, pokial robim taketo hromadne dopyty, aby ma mylne admini neidentifikovali ako utocnika? Samozrejme v ramci slusnosti taketo veci robim vtedy, ked predpokladam nizku navsetvnost webu.

Pre pridávanie komentárov sa musíte prihlásiť.

Pridať správu

Správy

Distribúcia arix linux s KDE 1

05.04 | 14:35 | Miroslav Bendík

Retro distribúcia arix prináša prostredie kde 1.1.2 na Debian 13 (trixie).

Zdroj: ariasft.github.io

2 komentáre | Zaujímavý projekt

Na Slovensku vyšla bezplatná knižka napísaná umelou inteligenciou

14.03 | 10:26 | Stanislav Hoferek

Dátum udalosti: 13.03.2024

V Greenie knižnici bola vydaná prvá kniha, ktorá je vytvorená z väčšiny umelou inteligenciou. Pokrýva udalosti Druhej svetovej vojny, vrátane rôznych doplnkových tém. Kniha je v angličtine.

Zdroj: Blog na Denníku N

Žiadne komentáre | IT novinky

Zaujímavý web o retro hardvéri

07.03 | 19:08 | redhawk1975

Retro web poskytuje informácie o starom hardvéri

Zdroj: The Retro Web

Žiadne komentáre | Zaujímavý projekt

Apple dostal pokutu 1,8 miliardy €

05.03 | 21:25 | redhawk1975

Ide o čiastkovú časť, ktorú riešia z dôvodu monopolného spravania sa v Appstore.

Zdroj: Európska Komisia

Žiadne komentáre | Novinky

DDoSia bot

04.03 | 14:19 | redhawk1975

Bot využívaný na útoky proti mnohým štátnym inštitúciam v celej Európe dosiahol novú veľkosť.

Žiadne komentáre | Bezpečnosť

Protimonopolný úrad SR sa vyjadril k vypínaniu českých televízií

29.02 | 08:53 | redhawk1975

Protimonopolný úrad zaujal stanovisko k problematike vypínania českých staníc u slovenských poskytovateľov televízie.

Zdroj: Vo svete IT

4 komentáre | Zaujímavý článok

Pomoc pre SK-Spell (PHP8)

25.02 | 17:59 | zdpo

Projekt SK-Spell hľadá programátorov pre dokončenie prechodu na PHP8.x pre projekty Synonymický slovník / SK-Openthesaurus a Online Slovníky / Glossword. V prípade ochoty pomôcť využite issue tracker na Githube alebo napíšte email na zdposter at gmail.com.

Zdroj: sk-spell

Žiadne komentáre | Zaujímavý projekt