< návrat zpět

MS Excel


Téma: Import externích dat - webový dotaz rss

Zaslal/a 23.11.2015 16:25

Řeším záhadu: Mám tabulku kam pomocí definice Data/Importovat externí data/Nový
webový dotaz (Excel 2003 SP3) importuju aktuální data investičních fondů z webu. V minulosti mi to vždy šlo a nyní mi nelze definovat oblast načtení dat u žádného z fondů CSOB. U aktuální verze stránek CSOB se mi nabízí pouze načtení celé stránky - načtení oblasti dat s aktuální cenou nelze definovat. Záhadou je, že mi to nelze definovat ani u stránek fondů, které jsem v minulosti definoval a do teď definovaný webový dotaz funguje (nelze jej ale definovat znovu)
Podotýkám, že jde o to, aby stránka byla definována tak, aby Excel při dotazu uměl rozeznat strukturovanou oblast s aktuální
cenou a datem aktualizace (je to např.
oblast první modré záložky s názvem "Základní informace") a umístil
tam možnost zatržítka pro definici dotazu (načtení).
Konkrétně mi jde např. o tento fond:
https://www.csob.cz/portal/lide/produkty/investicni-produkty/podilove-fondy/akciove-fondy/detail-fondu/-/isin/770000001170/1

Zaslat odpověď >

Strana:  1 2   další »
icon #028261
avatar
Obávam sa, že s tým nič neurobíš, páč vývojári v ČSOB pravdepodobne preprogramovali dané webové stránky a v novej verzii stránok už nepoužili rámce (tie oblasti, u ktorých vidíš čierne šípky v žltom štvorci) všade tam, kde by si potreboval/očakával.
Takže, buď budeš nútený naimportovať spústu balastu, alebo to bude chcieť kód, ktorý ti zo stránok vytiahne presne to, čo potrebuješ. Ani v jednom prípade to ale nebude tak jednoduché, ako si bol zvyknutý predtým, než na webovkách došlo k uvedenej zmene.citovat
#028267
avatar
AL: S vývojářema z CSOB jsem to řešil a oni tvrdí, že neví čím to je a že od doby kdy to fungovalo prý nic neměnili (možná jen mlží). Nicméně není divné, že import doteď funguje i na stránkách fondů, kde jsem ho definoval v době, kdy tam rámce podle všeho byly a nyní už nejsou?citovat
icon #028268
avatar
K tomu, čo tvrdíš, nemám vysvetlenie a ani to nijako nespochybňujem. Je možné, že tie dodatočné rámce sa stratili vďaka nejakému update IE. Môžem konštatovať len to, že v minulosti som na podobný problém narazil, totiž, že rámce na určitých stránkach sa stratili a to, čo mi fungovalo do tej doby, fungovať prestalo. Už je to pár rokov, čo som na to narazil. Vyriešil som to potom tak, že som naimportoval všetko, čo šlo, a ďalej pracoval len s tým, čo ma zaujímalo. Existujú však i spôsoby, ako z webových stránok dostať iba to, čo ťa zaujíma. To si ovšem už žiada nejaký ten kus VBA kódu, ktorý si siahne pre to, čo Ťa zaujíma, priamo do HTML/PHP. V týchto veciach som ale amatér, nemal som zatiaľ potrebu skutočne to riešiť. Pár vecí na túto tému tu v minulosti napísal palooo, toho som tu už ale nejaký ten týždeň nevidel, asi ho prestalo baviť radiť tu zadarmo, alebo má proste spústu inej práce.citovat
#028270
avatar
OK, díky za názor.citovat
#028271
avatar
Když neřeknete, co z dané stránky potřebujete, tak se radí špatně. Každopádně na "webový dotaz" můžete zapomenout, Excel zvládá jen prosté HTML, žádné výstupy ASP, CGI a bůhví, co ještě. Teoreticky - pokud vám to stojí za to - by bylo možné se podívat do kódu a zkusit webovou stránku parsovat pod VBA. Jinak dole na uvedené stránce nic z odkazů se nedá použít? Je tam i XLS.citovat
#028289
avatar
Ze stránek bych potřeboval tahat aktuální cenu a datum aktualizace, které jsou umístěny v modrém boxu v záložce Základní informace. Ten odkaz na xls přehled se použít nedá, nejsou tam aktuální data a struktura souboru se nepředvídatelně mění.
Zmíněné parsování pro mě asi nebude řešením, vůbec netuším o co jde. Je nějaká jiná možnost?citovat
#028531
elninoslov
Takto jednoducho, ak sa bude jednať o daný príklad. Každú z položiek možno prečítať podľa mena. Ak sa bude jednať o inak napísanú stránku, tak "vyhľadávacie" reťazce treba vo funkcii zmeniť, alebo prispôsobiť funkciu tak, aby boli voliteľné. V každom prípade ich ale musíme poznať (nazretím do kódu).
Příloha: rar28531_getwebdata.rar (15kB, staženo 15x)
citovat
#028532
avatar
Pro srovnání s výsledkem, který sem před chvilkou zaslal elninoslov, posílám výsledek, získaný pomocí mého doplňku ImportZwebu.xlam, který jsem před časem na toto fórum umístil. Aniž bych potřeboval studovat html dané stránky, získal jsem data z přílohy v čase hluboko pod jednu minutu od okamžiku zobrazení zdrojové stránky do výsledného importu v sešitě.
Příloha: zip28532_web.zip (7kB, staženo 18x)
citovat
#028543
avatar
Řešením je jednoznačně využití objektu Microsoft.XMLHTTP, jak uvedl elninoslov (trochu efektivněji by to chtělo ale parsovat přes class a další funkce než hned od začátku hledat v cyklu). Že je zdrojový kód ČSOB prasácký, to je, takže class má <div>, ale v něm je tabulka s pitomě formátovaným obsahem.

ad Vovka) Díky za zprávu "umím to", nikdo nevíme jak, příloha na pytel a filozofické řeči. Ztráta času.citovat
#028560
avatar
Jak je vidět, xlnc z fóra neodešel, jak vyhrožoval, a dále svým nevychovaně agresivním tónem komentuje snahu druhých při hledání odpovědí na kladené otázky.
Výrok "nikdo nevíme jak" se vztahuje k citovanému doplňku, který jsem na fórum před časem poslal. Xlnc se tak ztotožníl s pojmem "nikdo". Tehdy jsem prosil, abyste mi případné vady avizovali. Žádná odezva se nekonala. Teď jsem doplněk použil pro fórum já sám, a hned se vynořily dvě chyby. Prima, už jsem je opravil.
Výrok "příloha je na pytel" je soukromý soud od xlnc. Posílám novou přílohu, která srovnává výsledky od elninoslov s mými novými výsledky. Z nich plyne, že metoda, kterou použil elninoslov, poskytuje 8 jmen, z nichž jenom tři se vztahují k posuzované tabulce. Tím tu metodu nezatracuji, jen poukazuji na její nízkou efektivitu z hlediska vyhledání dat z posuzované tabulky. Předpokládám ale, že by šlo data z objektu Microsoft.XMLHTTP využít efektivněji.
Můj doplněk (znovu zdůrazňuji, že je pro uživatele fóra dostupný), poskytuje pro srovnání úplný obsah posuzované tabulky ("ztráta času"?). V nové příloze jsou už výsledky po provedených opravách doplňku (tedy bez zjištěných chyb).
Pokud by někdo přece jenom o můj opravený doplněk projevil zájem, může se soukromě obrátit na mou adresu, která je na fóru k dispozici. Mohu ho zaslat včetně obrázkového návodu k jeho použití.
Příloha: zip28560_getwebdatasrovnani.zip (19kB, staženo 21x)
citovat

Strana:  1 2   další »

Uživatelské menu

Nejste přihlášen(a)
avatar\n

Menu

On-line nástroje

Formulář Faktura

Formulář Faktura IV

Oblíbený formulář Faktura byl vylepšen a rozšířen.
Více se dočtete zde.

Aktivní diskuse

odpocet a storno tl.

PavDD • 28.3. 8:53

odpocet a storno tl.

Začátečník • 26.3. 14:39

odpocet a storno tl.

PavDD • 26.3. 10:22

odpocet a storno tl.

elninoslov • 26.3. 7:50

odpocet a storno tl.

PavDD • 26.3. 7:26

odpocet a storno tl.

elninoslov • 25.3. 22:34

odpocet a storno tl.

Začátečník • 25.3. 15:09