Cloudflare缓存研究与图床探索

Author： ModerRAS
发布时间：July 16, 2019
4326 views
No comments
5744 words
Categories：默认分类

写在开始

因为我之前用的图床i.loli.net有过几次502, 主要还是担心图床挂掉, 然后我存的图都没了, 我当时还到处找稳定的图床, 结果发现没有多少很稳定的还免费的还不限制容量的图床, 除了 sm.ms 之外还有个 imgur.com, 然后就是谷歌相册了, 也可能是我寻找的范围问题, 我只找到这么几个, 然后因为 sm.ms 是一个大佬个人的图床, 所以莫名有一种不稳定的感觉(其实应该是多虑了). 但是总之我还是想找个更靠谱点的图床来用. 不过我发现 imgur 和谷歌相册都属于一种被墙的状态, 所以直接拿来当图床那么我这个博客的大陆可访问性就会大大降低, 而且更别说谷歌相册分享出来的图片的链接长到个人感觉都有点影响文档体积了, 所以我打算写个东西来处理一下这两个图床的可访问性问题.

关于Cloudflare

这个在境外建站的同志们应该都清楚, 这是一个国外非常大的一个CDN厂, 主业是CDN和抗DDos, 当然前几天来了一个大规模502把我要吓死. 不过据说Cloudflare炸了好多次了, 炸一下也不奇怪, 所以就随它去炸好了, 反正一会就能好, 生意还是要做的.

Cloudflare可以给免费用户使用CDN, 这下子对我来说就比较方便了, 因为可以直接用它的CDN来给我做图床缓存和减速加速, 至少Cloudflare在大陆是可用的, 虽然可能某些运营商访问的速度慢了点.

关于CDN缓存, 官网上写的内容是:

此处应有官网链接

Cloudflare缓存不看你HTTP头, 只看你文件的扩展名, 所以不管什么图片只要你能换成Cloudflare支持的扩展名他就可以缓存了, 当然你可以说可以通过编写页面规则来缓存, 但是那个东西免费版只有3条规则的额度, 所以我并不舍得用.

所以知道了这些基础规则之后就可以直接编写一个反代程序来动态修改这些链接成一个可以被Cloudflare缓存的链接了, 因为我水平有限, 所以不知道怎么能直接用Apache或者Nginx或者Caddy来直接修改url满足要求, 所以我才想写个程序做这一部分

结构构思部分

接下来是基础架构. 一个get请求带着链接过来, 然后我301(302)跳转到反代服务器, 并把链接重写成Cloudflare支持的文件后缀. 在另一个反代服务器, 按照我的规则来请求对应的目标服务器, 请求完成之后返回数据给Cloudflare, 然后Cloudflare返回数据给前端, 整个过程就算结束了.

于是乎中间有一个跳转层, 反代服务器要知道请求过来的这个受支持的链接对应的是哪条目标链接. 这里如果不考虑持久化可以考虑用个内存数据库存一下映射关系, 然后一边往里面放, 另一边往外拿, 设置个超时时间防止内存溢出.

然而事实上我并没有这么做. 我使用一个 RocksDB ( Facebook 家优化版 LevelDB ) 把这个关系存起来了, 然后一边写, 另一边读, 中间的映射关系使用哈希映射, 链接的哈希就是对应的Cloudflare缓存的链接, 当然结尾得是受支持的文件类型.

代码编写部分

构思完了, 接下来就是编写代码的部分了

语言就用我最近一直在玩的 C# .NET Core 吧. 感觉这个东西还是挺有趣的, 而且写起来也很舒服.

我用 RocksDB 而不是 LevelDB 的原因也仅仅只是因为在 .NET 系里 RocksDB 的库下载量比 LevelDB 要高, 看起来更稳定一点.

那么使用的框架应该是 ASP.NET Core, 然后在里面使用 RESTful API 的工作方式.

两个关键的 Controller:

跳转用 Controller:

        // GET: <controller>
        [HttpGet]
        public IActionResult Get(string link) {
            var hash = HashHelper.Hash_SHA_256(link, false);
            db.Put(hash, link);
            return Redirect("https://此处应为你要反代的域名/"+hash+".jpg");
        }

反代用 Controller:

        // GET: <controller>
        [HttpGet("{url}")]
        public async Task<IActionResult> Get(string url) {
            var hash = url.Split(".")[0];
            var link = db.Get(hash); 
            return File(await Crawl(link), "image/jpeg");
        }

里面用到的 Crawl 函数:

        public async Task<byte[]> Crawl(string url) {
            var request = new HttpRequestMessage(HttpMethod.Get, url);
            request.Headers.Add("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3");
            request.Headers.Add("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36");

            var client = _clientFactory.CreateClient();

            var response = await client.SendAsync(request);
            return await response.Content.ReadAsByteArrayAsync();
        }

这个函数是用来请求目标服务器用的.

接下来还有一个关于数据库的封装, 因为是 ASP.NET Core, 所以调数据库肯定是用 DI 了, 然而这个 RocksDB 在官方的用法里没找到怎么使用依赖注入使用, 所以我也没啥办法, 只能手写一个了.

于是乎先写一个接口

public interface IKVDB {
    void Put(string K, string V);
    void Put(byte[] K, byte[] V);
    string Get(string K);
    byte[] Get(byte[] K);
    void Remove(string K);
    void Remove(byte[] K);
}

这个接口包含了我需要的函数.

然后再把原来的类封装一下, 表示我真的觉得这事有点过度封装了.

public class RocksDBImpl : IKVDB {
    private DbOptions options;
    private string DBPath;
    private RocksDb db;
    public RocksDBImpl(string DBPath) {
        options = new DbOptions().SetCreateIfMissing(true);
        this.DBPath = DBPath;
        db = RocksDb.Open(options, DBPath);
    }
    public string Get(string K) {
        return db.Get(K);
    }
    public byte[] Get(byte[] K) {
        return db.Get(K);
    }
    public void Put(string K, string V) {
        db.Put(K, V);
    }
    public void Put(byte[] K, byte[] V) {
        db.Put(K, V);
    }
    public void Remove(string K) {
        db.Remove(K);
    }
    public void Remove(byte[] K) {
        db.Remove(K);
    }
}

这个数据库我查了一阵子并没有发现到底该怎么依赖注入进程序里, 而且我也不知道这个 db 实例到底应不应该在每次写入和读取的时候重新打开. 不仅如此, 我还发现这个RocksDB这个类里并没有close()方法, 所以我就直接开一个单例, 然后这个db实例就这么一直开着了, 事实证明我一直开着似乎也不会出现什么数据未写入之类的问题. 反正我也不在乎数据是否有问题, 基本上我用的时候都会重新跳转一次使用, 而且据官方或者非官方称 RocksDB 是有一层内存缓存的, 也就是说热数据其实访问的时候都在内存里的, 所以写入到硬盘里也不会影响到整个程序的响应速度(这里来一条非官方链接, 讲的是关于Redis和LevelDB的).

依赖注入最后不要忘记在Startup.cs里面写进去偶

services.Add(item: new ServiceDescriptor(typeof(IKVDB), new RocksDBImpl("Database")));

因为整个程序太过于简陋, 导致我都不好意思把它扔到Github上去开源, 所以此处没有Github链接

最终效果

当然这第一次请求cf-cache-status一般都会MISS, 但是当你尝试清除缓存并重新加载的时候, 它就会变成HIT, 如下图:

当然, 这个缓存只是被Cloudflare这个缓存服务器缓存了, 如果你连了一个其他的Cloudflare节点, 比如你的一个客户在中国IP下访问了之后, 另一个用户使用了美国IP访问, 这两个用户连接的Cloudflare机房不相同, 在这种情况下两边的机房都会重新缓存这个图片, 也就是两个机房都要回源一次. 当然, 其他的用户访问这个资源的时候如果连到了相同的机房, 那么他们会访问缓存的数据

前端修改

这一段其实我修改的很简单粗暴

  var imgs = document.getElementsByTagName("img");
  for(var i = 0;i < imgs.length;i++) {
      imgs[i].src = "https://这里应填你做跳转的服务器域名/?="+imgs[i].src
  }

我直接在网站的主js里加了这么一条, 把网站的所有的图片的url前面加一个跳转, 这个问题就算解决了, 当然问题也很明显, 图片会加载两次, 一次是原图片, 一次是走了代理的图片, 不过考虑到接下来我的图片都是来自谷歌相册的, 所以也只是影响了海外用户的体验, 国内用户因为打不开谷歌相册所以并不会受太多影响.

写在最后

经过这一般奇特的操作之后我终于可以使用谷歌相册来当作一个稳定的图床了, 心情舒畅。

后记

代码已开源，开源协议MIT，代码在这里

Last modification：January 30, 2020

如果觉得我的文章对你有用，请随意赞赏

Cloudflare缓存研究与图床探索

ModerRAS • 2019 年 07 月 16 日

<h2>写在开始</h2>因为我之前用的图床<code>i.loli.net</code>有过几次502, 主要还是担心图床挂掉, 然后我存的图都没了, 我当时还到处找稳定的图床, 结果发现没有多少很稳定的还免费的还不限制容量的图床, 除了 <a class="no-external-link" href="https://sm.ms" target="_blank">sm.ms</a> 之外还有个 <a class="no-external-link" href="https://imgur.com" target="_blank">imgur.com</a>, 然后就是谷歌相册了, 也可能是我寻找的范围问题, 我只找到这么几个, 然后因为 <a class="no-external-link" href="https://sm.ms" target="_blank">sm.ms</a> 是一个大佬个人的图床, 所以莫名有一种不稳定的感觉(其实应该是多虑了). 但是总之我还是想找个更靠谱点的图床来用. 不过我发现 imgur 和谷歌相册都属于一种被墙的状态, 所以直接拿来当图床那么我这个博客的大陆可访问性就会大大降低, 而且更别说谷歌相册分享出来的图片的链接长到个人感觉都有点影响文档体积了, 所以我打算写个东西来处理一下这两个图床的可访问性问题.<h2>关于Cloudflare</h2>这个在境外建站的同志们应该都清楚, 这是一个国外非常大的一个CDN厂, 主业是CDN和抗DDos, 当然前几天来了一个大规模502把我要吓死. 不过据说Cloudflare炸了好多次了, 炸一下也不奇怪, 所以就随它去炸好了, 反正一会就能好, 生意还是要做的. Cloudflare可以给免费用户使用CDN, 这下子对我来说就比较方便了, 因为可以直接用它的CDN来给我做图床缓存和<del>减速</del>加速, 至少Cloudflare在大陆是可用的, 虽然可能某些运营商访问的速度慢了点.关于CDN缓存, 官网上写的内容是:<img src="https://cdn.miaostay.com/v1/image/sina/5e2ea3156128d.jpg" alt="" title="" style="">此处应有<a class="no-external-link" href="https://support.cloudflare.com/hc/en-us/articles/200172516-Which-file-extensions-does-Cloudflare-cache-for-static-content-" target="_blank">官网链接</a>Cloudflare缓存不看你HTTP头, 只看你文件的扩展名, 所以不管什么图片只要你能换成Cloudflare支持的扩展名他就可以缓存了, 当然你可以说可以通过编写页面规则来缓存, 但是那个东西免费版只有3条规则的额度, 所以我并不舍得用.所以知道了这些基础规则之后就可以直接编写一个反代程序来动态修改这些链接成一个可以被Cloudflare缓存的链接了, 因为我水平有限, 所以不知道怎么能直接用Apache或者Nginx或者Caddy来直接修改url满足要求, 所以我才想写个程序做这一部分<h2>结构构思部分</h2>接下来是基础架构. 一个get请求带着链接过来, 然后我301(302)跳转到反代服务器, 并把链接重写成Cloudflare支持的文件后缀. 在另一个反代服务器, 按照我的规则来请求对应的目标服务器, 请求完成之后返回数据给Cloudflare, 然后Cloudflare返回数据给前端, 整个过程就算结束了.于是乎中间有一个跳转层, 反代服务器要知道请求过来的这个受支持的链接对应的是哪条目标链接. 这里如果不考虑持久化可以考虑用个内存数据库存一下映射关系, 然后一边往里面放, 另一边往外拿, 设置个超时时间防止内存溢出. 然而事实上我并没有这么做. 我使用一个 RocksDB ( Facebook 家优化版 LevelDB ) 把这个关系存起来了, 然后一边写, 另一边读, 中间的映射关系使用哈希映射, 链接的哈希就是对应的Cloudflare缓存的链接, 当然结尾得是受支持的文件类型.<h2>代码编写部分</h2>构思完了, 接下来就是编写代码的部分了语言就用我最近一直在玩的 C# .NET Core 吧. 感觉这个东西还是挺有趣的, 而且写起来也很舒服.我用 RocksDB 而不是 LevelDB 的原因也仅仅只是因为在 .NET 系里 RocksDB 的库下载量比 LevelDB 要高, 看起来更稳定一点. 那么使用的框架应该是 ASP.NET Core, 然后在里面使用 RESTful API 的工作方式.两个关键的 Controller:跳转用 Controller:<pre><code class="c#"> // GET: &lt;controller&gt;
 [HttpGet]
 public IActionResult Get(string link) {
 var hash = HashHelper.Hash_SHA_256(link, false);
 db.Put(hash, link);
 return Redirect(&quot;https://此处应为你要反代的域名/&quot;+hash+&quot;.jpg&quot;);
 }</code></pre>反代用 Controller:<pre><code class="c#"> // GET: &lt;controller&gt;
 [HttpGet(&quot;{url}&quot;)]
 public async Task&lt;IActionResult&gt; Get(string url) {
 var hash = url.Split(&quot;.&quot;)[0];
 var link = db.Get(hash); 
 return File(await Crawl(link), &quot;image/jpeg&quot;);
 }</code></pre>里面用到的 Crawl 函数:<pre><code class="c#"> public async Task&lt;byte[]&gt; Crawl(string url) {
 var request = new HttpRequestMessage(HttpMethod.Get, url);
 request.Headers.Add(&quot;Accept&quot;, &quot;text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3&quot;);
 request.Headers.Add(&quot;User-Agent&quot;, &quot;Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36&quot;);

var client = _clientFactory.CreateClient();

Cloudflare缓存研究与图床探索

写在开始

关于Cloudflare

结构构思部分

代码编写部分

最终效果

前端修改

写在最后

后记

Leave a Comment Cancel reply
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

rime设置为默认简体

aria2的rpc调用方法

用 Alpine Linux 搭建软路由

Android 信任根证书的方法

在虚拟机安装 Bliss OS 时踩的坑

UE4在SMB中打开VS项目编译时报不支持操作的解决方法

n8n邀请邮件ssl错误问题

信号与系统实验

第一个相册

My second blog about github user profile parser

Cloudflare缓存研究与图床探索

写在开始

关于Cloudflare

结构构思部分

代码编写部分

最终效果

前端修改

写在最后

后记

Leave a Comment Cancel reply 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Cloudflare缓存研究与图床探索

Leave a Comment Cancel reply
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款