What the hell: Разбор HTML в Microsoft C Sharp

среда, 10 ноября 2010 г.

Разбор HTML в Microsoft C Sharp

Приятно когда опытные программисты делятся полезными идеями и даже кодом своих программ. Вот один из примеров. Для своего нового проекта мне понадобился разборщик HTML. Мне нужен очень простенький, где я мог бы для определенного атрибута вытащить его значение. В принципе в сети нашел несколько вариантов. Но остановился вот на этом:
Parsing HTML in Microsoft C#.
Очень советую. Все просто и нагладно показано. Вот пример как я его использую. Мне нужно получить реестров аукционов с сайта http://sberbank-ast.ru/PurchaseList.aspx Посмотрев HTML -код страницы нашел тег input c атрибутом name="ctl00$ctl00$phWorkZone$xmlData" - это для меня ключ поиска, но а потом у этого же тега вытаскиваю значение атрибута value со списком новых аукционов < input name="ctl00$ctl00$phWorkZone$xmlData" text="text" value="..здесь данные которые мне нужны... Вот код для получения этих данных:

tag ["value"].Value не совсем еще XML. Просто вместо "<" стоит &lt поэтому и понадобилась процедура для замены. Вот код этой процедуры

Вывод программы примерно следующий:

What the hell

среда, 10 ноября 2010 г.

Разбор HTML в Microsoft C Sharp

Комментариев нет:

Отправить комментарий

среда, 10 ноября 2010 г.

Разбор HTML в Microsoft C Sharp

Комментариев нет:

Отправить комментарий

среда, 10 ноября 2010 г.