当前位置：首页 > news >正文

Unity 离线文档快速访问处理文件

news 2025/11/20 0:59:04

unity官网访问本来就够慢了，下了离线文件依然很慢，和没有下载一样的感觉。查看打开原来是因为"https://cdn.cookielaw.org/scripttemplates/otSDKStub.js" 这个链接时间很长，查看了下基本上html都有这个，没次打开都是10s左右的时间。太慢了，看下都很卡。试着去掉"https://cdn.cookielaw.org/scripttemplates/otSDKStub.js"这个试了下访问很流畅湿滑。感觉这才像本地文件访问。于是把所以html的这个超链接全删了。在网上找了下别人写的源码，修改下，然后运行替换，完美，看文档总算不用卡了。

python代码如下：

#!/usr/bin/python
# -*- coding: UTF-8 -*-import os
import shutil
import timeimport bs4
import re
from bs4 import UnicodeDammitdef write_xml(text, out_path):# print(text)# text = text.encode("utf-8")# dammit = UnicodeDammit(text, ["utf-8"], smart_quotes_to="html")# print(dammit.unicode_markup)# UnicodeDammit(markup, ["windows-1252"], smart_quotes_to="html").unicode_markupwith open(out_path, mode='w', encoding='utf-8') as f:f.write(text)def filter_html(html_path, out_path):with open(html_path, "rb") as f:text = str(f.read(), encoding="utf-8")# text = re.sub(u"&quot;", "'", text)text = re.sub('"https://cdn.cookielaw.org/scripttemplates/otSDKStub.js"', "", text)# soup = bs4.BeautifulSoup(text, 'lxml')# for elem in soup.select('link'):#     if "href" in elem.attrs and elem.attrs["href"].find("google") != -1:#         elem.extract()# for elem in soup.select('script'):#     if len(elem.contents) > 0:#         content = elem.contents[0]#         if content.find("google") != -1:#             elem.extract()#     if "src" in elem.attrs and elem.attrs["src"].find("cookielaw") != -1:#         elem.extract()# for elem in soup.select('iframe'):#     if "src" in elem.attrs and elem.attrs["src"].find("google") != -1:#         elem.extract()write_xml(text, out_path)def handle_common_dir(dir_path, out_dir):if os.path.exists(out_dir):shutil.rmtree(out_dir)shutil.copytree(dir_path, out_dir)def filter_dir(dir_path, out_dir):print("处理文件夹: [{}] ----------------> ".format(dir_path))old_time = time.time()if os.path.exists(out_dir):shutil.rmtree(out_dir)os.makedirs(out_dir)docdata = os.path.join(dir_path, "docdata")if os.path.exists(docdata):shutil.copytree(docdata, os.path.join(out_dir, "docdata"))limit = 100000base_count = 500flag = 0for root, dirs, files in os.walk(dir_path):length = min(limit, len(files))for index, name in enumerate(files):if name.find(".html") == -1:continuepath = os.path.join(root, name)out_path = os.path.join(out_dir, name)# print("-----> filter file: \"{}\"".format(name))if flag > base_count and ((flag % base_count) == 0 or (index == length - 1)):print("正在处理第: {}个文件".format(flag))try:flag = flag + 1filter_html(path, out_path)except Exception as e:print("执行出错: " + str(e))if index == length - 1:breakprint("----> 执行耗时: {}".format(time.time() - old_time))# ---------------------------------------------------------------------------print("开始执行, 请等待!")source_dir = "D:/A/Documentation/en"
out_dir = os.path.join(source_dir, "out")# 处理公共部分
# staticFiles_source_dir = os.path.join(source_dir, "StaticFiles")
# uploads_source_dir = os.path.join(source_dir, "uploads")# staticFiles_out_dir = os.path.join(out_dir, "StaticFiles")
# uploads_out_dir = os.path.join(out_dir, "uploads")# handle_common_dir(staticFiles_source_dir, staticFiles_out_dir)
# handle_common_dir(uploads_source_dir, uploads_out_dir)# ---------------------------------------------------------------------------# 处理手册
manual_source_dir = os.path.join(source_dir, "Manual")
manual_out_dir = os.path.join(out_dir, "Manual")filter_dir(manual_source_dir, manual_out_dir)# ---------------------------------------------------------------------------# 处理脚本API
script_source_dir = os.path.join(source_dir, "ScriptReference")
script_out_dir = os.path.join(out_dir, "ScriptReference")filter_dir(script_source_dir, script_out_dir)

再用nginx启动本地服务，直接访问方便查看文档。一下就舒服多了。

查看全文

http://www.mrgr.cn/news/12205.html