600字范文,内容丰富有趣,生活中的好帮手!
600字范文 > c#正则表达式取出数据库中带html标签的内容 C#用正则表达式 获取网页源代码标签的属

c#正则表达式取出数据库中带html标签的内容 C#用正则表达式 获取网页源代码标签的属

时间:2023-09-23 05:29:02

相关推荐

c#正则表达式取出数据库中带html标签的内容 C#用正则表达式 获取网页源代码标签的属

1.有url获取到网页源代码:

using System.Web;

using System.IO;

using ;

private void GetHtmlinfo(string PageUrl)

{

WebRequest request = WebRequest.Create(PageUrl);

WebResponse response = request.GetResponse();

Stream resStream = response.GetResponseStream();

StreamReader sr = new StreamReader(resStream, System.Text.Encoding.UTF8);

string htmlinfo = sr.ReadToEnd();

resStream.Close();

sr.Close();

}

2.获取标签中的值:

using System.Text.RegularExpressions;

/// 获取字符中指定标签的值

///

/// 字符串

/// 标签

/// 值

public static string GetTitleContent(string str, string title1, string title2)

{

string tmpStr = string.Format("]*?>(?[^", title1, title2); //获取之间内容

Match TitleMatch = Regex.Match(str, tmpStr, RegexOptions.IgnoreCase);

string result = TitleMatch.Groups["Text"].Value;

return result;

}

Example:

HTML 源文件:现排名:20

Parameter: title1 = @"span class=""t1_tx"">现排名:

title2 - "b";

3.获取标签中的属性:

/// 获取字符中指定标签的值

///

/// 字符串

/// 标签

/// 属性名

/// 属性

public static string GetTitleContent(string str, string title,string attrib)

{

string tmpStr = string.Format("]*?{1}=(['\"\"]?)(?[^'\"\"\\s>]+)\\1[^>]*>", title, attrib); //获取之间内容

Match TitleMatch = Regex.Match(str, tmpStr, RegexOptions.IgnoreCase);

string result = TitleMatch.Groups["url"].Value;

return result;

}

[转载]C#用正则表达式 获取网页源代码标签的属性或值

最近调试程序需要用到获取网页指定标签的属性和值,找到了一个比较好的正则匹配方法,特此备份. [原]C#用正则表达式 获取网页源代码标签的属性或值 整理两个 在C#中,用正则表达式 获取网页源代码标签的 ...

C#用正则表达式 获取标签的属性或值

整理两个 在C#中,用正则表达式 获取网页源代码标签的属性或值的方法 : 1.获取标签中的值: string str="

delphi 获取网页源代码

//获取网页源代码 var s: string; begin s := WebBrowser1.OleObject.document.body.innerHTML; //body内的所有代码 ...

Java 网络爬虫获取网页源代码原理及实现

Java 网络爬虫获取网页源代码原理及实现 1.网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成.传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL ...

c#利用WebClient和WebRequest获取网页源代码的比较

前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取 ...

JS远程获取网页源代码的例子

js代码获取网页源代码. 代码:htmlPUBLIC"-//W3C//DTDHTML4.01Transitional//EN"> &lt ...

c#利用WebClient和WebRequest获取网页源代码

C#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取网页源代码 WebClient类 WebClient ...

c#利用HttpWebRequest获取网页源代码

c#利用HttpWebRequest获取网页源代码,搞了好几天终于解决了,直接获取网站编码进行数据读取,再也不用担心乱码了! 命名空间:Using private static ...

js技术要点---JS 获取网页源代码

JS 获取网页源代码

随机推荐

Linux_10个需要了解的Linux网络和监控命令(转)

源文地址://10/15325.html 1. hostname hostname 没有选项,显示主机名字 hostname –d 显示机器所属域名 ...

gulp watch error ENOSPC

in linux you fix this with the command:echo fs.inotify.max_user_watches=524288 | sudo tee -a /etc/sy ...

Java的多线程机制系列:(三)synchronized的同步原理

synchronized关键字是JDK5之实现锁(包括互斥性和可见性)的唯一途径(volatile关键字能保证可见性,但不能保证互斥性,详细参见后文关于vloatile的详述章节),其在字节码上编译为 ...

http://backboneconf.com/ @前端 真好

/ @前端/ @前端/ @前端http://backbonec ...

An erroroccurred while filtering resources

maven报错: maven An error occurred while filtering resources Maven -> Update Project... resolved th ...

@ControllerAdvice详解

@ControllerAdvice,是Spring3.2提供的新注解,从名字上可以看出大体意思是控制器增强.让我们先看看@ControllerAdvice的实现: package org.spri ...

Android Studio--gradle:download 过慢甚至超时timeout报错

问题描述 今天第一次学习安卓,配置环境花了不少时间其他都比较容易的解决了 gradle 因为会从外国的网站下载东西会非常的慢(具体原理我也不清楚),所以最好让下载地址变成国内的 解决方案(最后有升级方 ...

一个简单的makefile文件

一个简单的makefile文件:可以编译指定目录下的所有c和cpp文件,暂未加入自动头文件的依赖. #!/bin/bash #编译器 CROSS_COMPILING_PATH = #源文件路径 VPA ...

Spring整体了解

1.spring原理 内部最核心的就是IOC了,动态注入,让一个对象的创建不用new了,可以自动的生产,这其实就是利用java里的反射,反射其实就是在运行时动态的去创建.调用对象,Spring就是 ...

JVM规范系列第1章:引言

如果你还没下载这本书,那么先点击这里下载再一块儿看吧. 前言 Java 虚拟机是一个抽象化的机器,整个规范中提及的 Java 虚拟机都是抽象化的概念,而不是特指 Or ...

c#正则表达式取出数据库中带html标签的内容 C#用正则表达式 获取网页源代码标签的属性或值...

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。