URL短链接压缩算法-短网址一一映射

微博短地址原理解析 (Java实现)

一种方法是调用第三方提供短址服务的接口来生成即可。一般他们提供接口或调用包。

如:


怎样调用百度短网址api?  http://www.baidu.com/search/dwz.html (无需授权即可调用)




新浪短网址API接口(6月13日更新)




新浪更新后的长网址转短网址官方API文档:http://open.weibo.com/wiki/2/short_url/shorten

调用地址:https://api.weibo.com/2/short_url/shorten.json

请求方式:GET

请求参数:

  1. access_token:  授权后获得

  2. url_long:  待转换的长地址

返回结果:

URL短链接压缩算法-短网址一一映射 短网址资讯 第1张
{
    "urls": [
        {
            "url_short": "http://t.cn/h4DwT1",
            "url_long": "http://finance.sina.com.cn/",
            "type": 0,
            "result": "true"
        }
    ]
}
URL短链接压缩算法-短网址一一映射 短网址资讯 第2张

注意:每次使用时都需要access_token,而access_token是需要登录后授权才能得到的。如果你想做一个短网址转换的应用,肯定不能要求用户先登录微博、授权、然后才能使用你的功能,这样用户体验太差。你可以在服务器端用个测试帐号定期授权来获取access_token,这样就不需要用户登录微博授权了,用户可以直接输入长网址,获取转换后的短网址。

关于如何授权获取access token,请参考这篇博文:http://www.ft12.com/


第二种方法是自己实现,可以单独搭建服务器提供短网址映射服务。

(

有个关键点 ..短网址 是否可以直接通过算法还原..如果不能直接通过算法还原..

需要借助存储(无论是db,缓存,nosql或者别的什么),那么其实采用什么样的算法都不是重点.

)


 最近,项目中需要用到短网址(ShortUrl)的算法,于是在网上搜索一番,发现有C#的算法,有.Net的算法,有PHP的算法,就是没有找到Java版的短网址(ShortUrl)的算法,很是郁闷。同时还发现有不少网友在发帖求助,怎么实现Java版的短网址(ShortUrl)的算法。干脆一不做,二不休,参考了一下网上比较流行的php版短网址(ShortUrl)算法:

再根据自己的理解,用Java实现了该短网址(ShortUrl)的算法。(\(^o^)/YES!我还真厉害!)

先来废话一下,是在别人的帖子上看到的,主要是让大家了解一下短网址(ShortUrl)。

时下,短网址应用已经在全国各大微博上开始流行了起来。例如QQ微博的url.cn,新浪的t.cn等。

我们在新浪微博上发布网址的时候,微博会自动判别网址,并将其转换,例如:http://t.cn/hrYnr0。为什么要这样做的,原因我想有这样几点:

1、微博限制字数为140字一条,那么如果我们需要发一些连接上去,但是这个连接非常的长,以至于将近要占用我们内容的一半篇幅,这肯定是不能被允许的,所以短网址应运而生了。

2、短网址可以在我们项目里可以很好的对开放级URL进行管理。有一部分网址可以会涵盖性、暴力、广告等信息,这样我们可以通过用户的举报,完全管理这个连接将不出现在我们的应用中,应为同样的URL通过加密算法之后,得到的地址是一样的。

3、我们可以对一系列的网址进行流量,点击等统计,挖掘出大多数用户的关注点,这样有利于我们对项目的后续工作更好的作出决策。

其实以上三点纯属个人观点,因为在我接下来的部分项目中会应用到,所以就了解了一下,下面先来看看短链接映射算法的理论(网上找到的资料):

① 将长网址用md5算法生成32位签名串,分为4段,,每段8个字符;

② 对这4段循环处理,取每段的8个字符, 将他看成16进制字符串与0x3fffffff(30位1)的位与操作,超过30位的忽略处理;

③ 将每段得到的这30位又分成6段,每5位的数字作为字母表的索引取得特定字符,依次进行获得6位字符串;

④ 这样一个md5字符串可以获得4个6位串,取里面的任意一个就可作为这个长url的短url地址。

很简单的理论,我们并不一定说得到的URL是唯一的,但是我们能够取出4组URL,这样几乎不会出现太大的重复。

首先,请大家了解在Java中如何用MD5来加密字符串得到32位的加密后的字符串,下面是我已经封装好的JavaMD5算法:

  1. private final static String[] hexDigits = {  

  2.       "0""1""2""3""4""5""6""7",   

  3.       "8""9""a""b""c""d""e""f"};   

  4.   

  5.     public static String byteArrayToHexString(byte[] b){  

  6.         StringBuffer resultSb = new StringBuffer();  

  7.         for (int i = 0; i < b.length; i++){  

  8.             resultSb.append(byteToHexString(b[i]));  

  9.         }  

  10.         return resultSb.toString();  

  11.     }  

  12.   

  13.     private static String byteToHexString(byte b){  

  14.         int n = b;  

  15.         if (n < 0)  

  16.             n = 256 + n;  

  17.         int d1 = n / 16;  

  18.         int d2 = n % 16;  

  19.         return hexDigits[d1] + hexDigits[d2];  

  20.     }  

  21.   

  22.     public static String MD5Encode(String origin){  

  23.         String resultString = null;  

  24.             try {  

  25.                   

  26.                 resultString=new String(origin);  

  27.                 MessageDigest md = MessageDigest.getInstance("MD5");  

  28.                   

  29.                 resultString.trim();  

  30.   

  31.                 resultString=byteArrayToHexString(md.digest(resultString.getBytes("UTF-8")));  

  32.             }catch (Exception ex){}  

  33.             return resultString;  

  34.         }  

  35.   

  36.     public static void main(String[] args)   

  37.     {  

  38.       

  39.         String data = "189022881112011111118:09sz0000123456789987654321";  

  40.         System.out.println(MD5Encode(data));  

  41.     }  

 

 


 

  1. public class ShortUrl {   

  2.     public static void main(String[] args) {   

  3.         String url = "http://www.sunchis.com";   

  4.         for (String string : ShortText(url)) {   

  5.             print(string);   

  6.         }   

  7.     }   

  8.        

  9.     public static String[] ShortText(String string){   

  10.         String key = "XuLiang";                 //自定义生成MD5加密字符串前的混合KEY   

  11.         String[] chars = new String[]{          //要使用生成URL的字符   

  12.             "a","b","c","d","e","f","g","h",   

  13.             "i","j","k","l","m","n","o","p",   

  14.             "q","r","s","t","u","v","w","x",   

  15.             "y","z","0","1","2","3","4","5",   

  16.             "6","7","8","9","A","B","C","D",   

  17.             "E","F","G","H","I","J","K","L",   

  18.             "M","N","O","P","Q","R","S","T",   

  19.             "U","V","W","X","Y","Z"   

  20.         };   

  21.            

  22.         String hex = MD5Encode(key + string);   

  23.         int hexLen = hex.length();   

  24.         int subHexLen = hexLen / 8;   

  25.         String[] ShortStr = new String[4];   

  26.            

  27.         for (int i = 0; i < subHexLen; i++) {   

  28.             String outChars = "";   

  29.             int j = i + 1;   

  30.             String subHex = hex.substring(i * 8, j * 8);   

  31.             long idx = Long.valueOf("3FFFFFFF"16) & Long.valueOf(subHex, 16);   

  32.                

  33.             for (int k = 0; k < 6; k++) {   

  34.                 int index = (int) (Long.valueOf("0000003D"16) & idx);   

  35.                 outChars += chars[index];   

  36.                 idx = idx >> 5;   

  37.             }   

  38.             ShortStr[i] = outChars;   

  39.         }   

  40.            

  41.         return ShortStr;   

  42.     }   

  43.        

  44.     private static void print(Object messagr){   

  45.         System.out.println(messagr);   

  46.     }   

  47. }   


 

下面来看看程序部分:现在可以直接使用ShortText(url)方法,可以等到下面四组值:

 

  1. ShortText("http://www.sunchis.com")[0];  //得到值:Jzyqma   

  2. ShortText("http://www.sunchis.com")[1];  //得到值:QBrMzm   

  3. ShortText("http://www.sunchis.com")[2];  //得到值:bQreM3   

  4. ShortText("http://www.sunchis.com")[3];  //得到值:VNBRna   


选取结果中四个值的任何一个值即可作为URL对应生成的短网址了。


发表评论:

Copyright ft12.com All Rights Reserved.