首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从网页中提取信息并粘贴到excell C#或Javascript中

从网页中提取信息并粘贴到Excel可以使用C#或JavaScript来实现。下面是两种语言的实现方式:

C#实现:

代码语言:csharp
复制
using System;
using System.IO;
using System.Net;
using System.Text.RegularExpressions;
using Excel = Microsoft.Office.Interop.Excel;

class Program
{
    static void Main()
    {
        // 获取网页内容
        string url = "https://example.com"; // 替换为目标网页的URL
        string html = GetHtml(url);

        // 提取信息
        string extractedData = ExtractData(html);

        // 将提取的信息粘贴到Excel
        PasteToExcel(extractedData);
    }

    static string GetHtml(string url)
    {
        using (WebClient client = new WebClient())
        {
            return client.DownloadString(url);
        }
    }

    static string ExtractData(string html)
    {
        // 使用正则表达式提取信息
        string pattern = @"<div class=""data"">(.*?)</div>"; // 替换为适合目标网页的正则表达式
        MatchCollection matches = Regex.Matches(html, pattern, RegexOptions.Singleline);

        // 将提取的信息拼接为字符串
        string extractedData = "";
        foreach (Match match in matches)
        {
            extractedData += match.Groups[1].Value + Environment.NewLine;
        }

        return extractedData;
    }

    static void PasteToExcel(string data)
    {
        // 创建Excel应用程序对象
        Excel.Application excelApp = new Excel.Application();
        excelApp.Visible = true;

        // 创建新的工作簿
        Excel.Workbook workbook = excelApp.Workbooks.Add();
        Excel.Worksheet worksheet = workbook.ActiveSheet;

        // 将数据拆分为行
        string[] rows = data.Split(new[] { Environment.NewLine }, StringSplitOptions.RemoveEmptyEntries);

        // 将数据逐行写入Excel
        for (int i = 0; i < rows.Length; i++)
        {
            string[] columns = rows[i].Split('\t');
            for (int j = 0; j < columns.Length; j++)
            {
                worksheet.Cells[i + 1, j + 1] = columns[j];
            }
        }

        // 保存并关闭Excel
        workbook.SaveAs("output.xlsx"); // 替换为输出文件的路径
        workbook.Close();
        excelApp.Quit();
    }
}

JavaScript实现:

代码语言:javascript
复制
const axios = require('axios');
const fs = require('fs');
const xlsx = require('xlsx');

// 获取网页内容
const url = 'https://example.com'; // 替换为目标网页的URL
axios.get(url)
  .then(response => {
    const html = response.data;

    // 提取信息
    const extractedData = extractData(html);

    // 将提取的信息粘贴到Excel
    pasteToExcel(extractedData);
  })
  .catch(error => {
    console.error(error);
  });

function extractData(html) {
  // 使用正则表达式提取信息
  const pattern = /<div class="data">(.*?)<\/div>/g; // 替换为适合目标网页的正则表达式
  const matches = html.match(pattern);

  // 将提取的信息拼接为字符串
  let extractedData = '';
  for (const match of matches) {
    extractedData += match.replace(/<.*?>/g, '') + '\n';
  }

  return extractedData;
}

function pasteToExcel(data) {
  // 创建工作簿
  const workbook = xlsx.utils.book_new();
  const worksheet = xlsx.utils.aoa_to_sheet(data.split('\n').map(row => row.split('\t')));
  xlsx.utils.book_append_sheet(workbook, worksheet, 'Sheet1');

  // 保存Excel文件
  const outputFilePath = 'output.xlsx'; // 替换为输出文件的路径
  xlsx.writeFile(workbook, outputFilePath);
}

以上代码示例演示了如何从网页中提取信息并将其粘贴到Excel中。请注意,代码中的正则表达式和输出文件路径需要根据实际情况进行修改。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

没有搜到相关的视频

领券