Компьютерный форум NoWa.cc Здесь может быть Ваша реклама
Правила Форума
редакция от 22.06.2020
Форум .::NoWa.cc::.
Вернуться   Компьютерный форум NoWa.cc > В помощь вебмастеру > Программирование > Delphi

Уважаемые пользователи nowa.cc. Мы работаем для вас более 20 лет и сейчас вынуждены просить о финансовой помощи по оплате за сервер.
Окажите посильную поддержку, мы очень надеемся на вас. Реквизиты для переводов ниже.
Webmoney Webmoney WMZ: Z021474945171 Webmoney WME: E159284508897 Webmoney WMUSDT: T206853643180
Кошелёк для вашей помощи YooMoney 4100117770549562
YooMoney Спасибо за поддержку!

Ответ
 
Опции темы Опции просмотра Language
Старый 25.04.2008, 09:58   #1
Неактивный пользователь
 
Аватар для Apollo11
 
Пол:Мужской
Регистрация: 24.04.2008
Сообщений: 7
Репутация: 0
По умолчанию Как Получить текст из HTML

Имеется веб страница с текстом и таблицами, данные в ней меняются. Как получить данные (каким методом) на TWEBBrowser сильно тормозит, на IdHTTP при GET выдает в строке плайн текст с тегами, которые нужно фильтровать. Может быть есть более простой способ?
Apollo11 вне форума
 
Ответить с цитированием Вверх
Здесь может быть Ваша реклама
Здесь может быть Ваша реклама


Реклама: зарубежные комедии лучшиепирог кровли барнхаусподарочные боксы заказатьшкурка л 230х280 л2 51с р400 г 10054-82siemens rmh760b-1 в нижневартовске


Старый 04.05.2008, 10:07   #2
Dmitry_Ukr
Неактивный пользователь
 
Регистрация: 04.05.2008
Сообщений: 5
Репутация: 1
По умолчанию Ответ: Как Получить текст из HTML

Если это ваша страница, то перепишите ее на Web-сервисы. Если нет, то лучше попробовать поискать другие компоненты. Или даже воспользоваться библиотекой wininet.pas.
Dmitry_Ukr вне форума
 
Ответить с цитированием Вверх
Старый 05.05.2008, 15:22   #3
Apollo11
Неактивный пользователь
 
Аватар для Apollo11
 
Пол:Мужской
Регистрация: 24.04.2008
Сообщений: 7
Репутация: 0
По умолчанию Ответ: Как Получить текст из HTML

Стрница не моя. Где можео взять wininet.pas?
Apollo11 вне форума
 
Ответить с цитированием Вверх
Старый 06.05.2008, 02:09   #4
Dmitry_Ukr
Неактивный пользователь
 
Регистрация: 04.05.2008
Сообщений: 5
Репутация: 1
По умолчанию Ответ: Как Получить текст из HTML

Program Files\Borland\Delphi\Source\Rtl\Win\wininet.pas

http://www.rsdn.ru/article/inet/wininet_delphi.xml

С html можно работать так же как с xml. Так что можете загрузить его в xml и оттуда выдергивать интересующую информацию. Или поищите компоненты уже решающие задачу отображения html.

Последний раз редактировалось Dmitry_Ukr; 06.05.2008 в 02:15..
Dmitry_Ukr вне форума
 
Ответить с цитированием Вверх
Старый 06.05.2008, 08:28   #5
maker2k
Неактивный пользователь
 
Регистрация: 06.05.2008
Сообщений: 3
Репутация: 0
По умолчанию Ответ: Как Получить текст из HTML

XMLDocument в помощь!
maker2k вне форума
 
Ответить с цитированием Вверх
Старый 18.05.2008, 13:21   #6
DarkLordZ
Неактивный пользователь
 
Пол:Мужской
Регистрация: 05.04.2008
Сообщений: 3
Репутация: 0
По умолчанию Ответ: Как Получить текст из HTML

Код:
var
  HTMLDoc: IHtmlDocument2;
begin
  HTMLDoc := WebBrowser1.Document as IHtmlDocument2;
  Memo1.Text:=HTMLDoc.body.innerText;
  while HTMLDoc.readyState <> 'complete' do Application.ProcessMessages;
end;
DarkLordZ вне форума
 
Ответить с цитированием Вверх
Старый 19.05.2008, 09:03   #7
Apollo11
Неактивный пользователь
 
Аватар для Apollo11
 
Пол:Мужской
Регистрация: 24.04.2008
Сообщений: 7
Репутация: 0
По умолчанию Ответ: Как Получить текст из HTML

DarkLordZ этот метод мне известен, я писал выше что TWebBrowser медленно грузится и искал ему альтернативу.
Apollo11 вне форума
 
Ответить с цитированием Вверх
Старый 19.05.2008, 23:08   #8
DarkLordZ
Неактивный пользователь
 
Пол:Мужской
Регистрация: 05.04.2008
Сообщений: 3
Репутация: 0
По умолчанию Ответ: Как Получить текст из HTML

Цитата:
Сообщение от Apollo11 Посмотреть сообщение
DarkLordZ этот метод мне известен, я писал выше что TWebBrowser медленно грузится и искал ему альтернативу.

Альтернатива тут не поможет. Фактически, страница - это определённое кол-во информации, которое нужно принять прежде, чем извлекать оттуда текст.
Посему, необходимо просто настроить бровсер таким образом, чтобы лишняя информация не передавалась изначально, либо скипалась при показе.
Если нужнен только текст, то можно смело отключить в бровсере видео, аудио, скрипты (в большинстве случаев) и т.п.

Сам так делаю. Пользуюсь немного модифицированным бровсером. Скорость загрузки и отображения настолько высока, что успеваю на лету парсить вытянутый текст, писать его в буфер и подчитывать БД, при необходимости.
Обрабатываю в секунду по 3-5 страниц, забитых текстом и баннерами по самое не могу и размером по 2-3 экрана.
DarkLordZ вне форума
 
Ответить с цитированием Вверх
Старый 20.05.2008, 09:52   #9
Apollo11
Неактивный пользователь
 
Аватар для Apollo11
 
Пол:Мужской
Регистрация: 24.04.2008
Сообщений: 7
Репутация: 0
По умолчанию Ответ: Как Получить текст из HTML

DarkLordZ, не могли бы привести пример?
Apollo11 вне форума
 
Ответить с цитированием Вверх
Старый 20.05.2008, 17:33   #10
DarkLordZ
Неактивный пользователь
 
Пол:Мужской
Регистрация: 05.04.2008
Сообщений: 3
Репутация: 0
По умолчанию Ответ: Как Получить текст из HTML

Вкратце суть такова:
1. Создаем наследника от TWebBrowser с расширенным функционалом, в котором доступны DownloadOptions.
2. Настраиваем опции по собственному усмотрению.
3. Радуемся жизни

Примерчик:
http://www.delphikingdom.com/asp/ans...IDAnswer=43912

70% кода можно прибить, без вреда для здоровья, убрав такие вещи, как операции с меню, рамкой и прочую фигню, которая не нужна в данной задаче.
Главное - DownloadOptions.
DarkLordZ вне форума
 
Ответить с цитированием Вверх
Старый 09.06.2009, 17:45   #11
_Link_
Неактивный пользователь
 
Пол:Мужской
Регистрация: 08.04.2008
Сообщений: 2
Репутация: 0
По умолчанию Re: Ответ: Как Получить текст из HTML

Еще есть независимые парсеры HTML
_Link_ вне форума
 
Ответить с цитированием Вверх
Старый 19.06.2009, 12:44   #12
Wizard2007
Постоялец
 
Пол:Мужской
Регистрация: 19.10.2007
Сообщений: 272
Репутация: 4
По умолчанию Re: Как Получить текст из HTML

Заравствуйте, может быть воапрос не совсем в тему, но как из делфи узнать IP - Адрес с которым компьютер выходит в интернет? Как например на многих сайтах пишут IP - адрес, с которго в последний ра посещался сайт.
Wizard2007 вне форума
 
Ответить с цитированием Вверх
Старый 20.06.2009, 11:20   #13
tomor
Постоялец
 
Аватар для tomor
 
Пол:Мужской
Регистрация: 05.02.2007
Адрес: Иваново
Сообщений: 290
Репутация: 646
По умолчанию Re: Как Получить текст из HTML

Wizard2007, Посмотри на DelphiWorld
tomor вне форума
 
Ответить с цитированием Вверх
Старый 10.07.2009, 21:49   #14
Wizard2007
Постоялец
 
Пол:Мужской
Регистрация: 19.10.2007
Сообщений: 272
Репутация: 4
По умолчанию Re: Как Получить текст из HTML

А можно ли получить ссылки, которые генерируются при помощи JavaScript, на лету . Т.е. в момент загрузки странички. и в коде не прописываются.

Последний раз редактировалось Wizard2007; 13.07.2009 в 09:31..
Wizard2007 вне форума
 
Ответить с цитированием Вверх
Старый 01.09.2009, 09:50   #15
wellrus
Пользователь
 
Пол:Мужской
Регистрация: 19.03.2009
Сообщений: 46
Репутация: 7
По умолчанию Re: Как Получить текст из HTML

Конечно можно. Кто мешает вызвать функцию яваскрипт ссамостоятельно?
wellrus вне форума
 
Ответить с цитированием Вверх
Ответ


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Fresh HTML - редактор для верстки html и css страниц Risovod Интернет и Сети 14 05.02.2012 01:29
Защитить html текст страницы от копирования , возможно-ли , как ? flirts Скорая помощь 6 19.09.2009 13:36
Получить ссылку Akuji PHP 1 25.03.2008 15:23
Получить выделенный текст в переменную Colix Java Script 1 03.09.2007 16:13

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 02:55. Часовой пояс GMT +3.


Copyright ©2004 - 2026 NoWa.cc

Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2026, vBulletin Solutions, Inc. Перевод: zCarot
Время генерации страницы 0.07481 секунды с 11 запросами