介绍
本文主要介绍RPC是什么, 为什么要使用RPC,使用RPC需要解决问题及RPC使用实例
RPC是什么
RPC(Remote Procedure Call)远程过程调用协议,一种通过网络从远程计算机上请求服务,而不需要了解底层网络技术的协议。RPC它假定某些协议的存在,例如TPC/UDP等,为通信程序之间携带信息数据。在OSI网络七层模型中,RPC跨越了传输层和应用层,RPC使得开发,包括网络分布式多程序在内的应用程序更加容易。
简单一点说:就是向远程服务器发送请求,做业务处理或任务计算等(即程序),就是想要把调用远程服务器中方法的过程和像调用本地方法一样简单。
为什么要使用RPC
当我们无法在一个进程内,甚至通过本第地调用的方式满足我们的需求时,比如我们的通讯系统,甚至不同的组织间的通讯,由于计算能力需要横向扩展,需要在多台机器组成的集群上部署应用,这才能是我们进行远程的通讯;又或者说电商系统,我们不可能靠着本地调用就能满足我们的需求,例如提交订单的处理方法,库存处理方法等在本地调用,在肯定是不行的,这是用户发起相应的请求由我们远程服务器去做业务处理和计算的。所以RPC就显得如此重要了。
使用RPC需要解决问题
这里我们来看,我们想象一下当我们在远程调用(也就是使用RPC)的过程中,我们需要执行的函数或者方法在远程机器上,例如我们要调用远程计算机的add方法,下面就会有这几个问题:
- Call ID映射。 我们要怎么告诉远程计算机我们需要调用的是add方法,而不是reduce方法, mult方法,divi方法等,在本地调用中,函数体是直接通过函数指针来指定的,当我们调用本地add方法时,编译器会自动给我们调用到它相应的函数指针,而在远程调用中,使用指针明显是不行的,因为两个进程的地址不同。所以,在RPC中,所有函数都必须有一个唯一的ID,这个ID在所有进程中都是唯一确定的,客户端在调用时都必须附加上这个ID,然后我们还需要在客户端和服务端分别维护一个{ 函数 <—–> Call ID } 的对应表,两者的表不一定需要完全相同,但相同的函数对应的Call ID必须相同,当客户端需要进行远程调用时,它就查一下这个表,找出相应的Call ID,然后把它传给服务端,服务端也通过查表,来确定客户端需要调用的函数,然后执行相应函数的代码。
- 序列化及反序列化。客户端怎么把参数值传给远程的函数呢?在本地调用中,我们只需要把参数压到栈里,然后让函数自己去栈里读就行。但是在远程过程调用时,客户端跟服务端是不同的进程,不能通过内存来传递参数。甚至有时候客户端和服务端使用的都不是同一种语言(比如服务端用C++,客户端用Java或者Go)。这时候就需要客户端把参数先转成一个字节流,传给服务端后,再把字节流转成自己能读取的格式。这个过程叫序列化和反序列化。同理,从服务端返回的值也需要序列化反序列化的过程。
- 整个流程如下:
- 网络传输。远程调用往往用在网络上,客户端和服务端是通过网络连接的。所有的数据都需要通过网络传输,因此就需要有一个网络传输层。网络传输层需要把Call ID和序列化后的参数字节流传给服务端,然后再把序列化后的调用结果传回客户端。只要能完成这两者的,都可以作为传输层使用。因此,它所使用的协议其实是不限的,能完成传输就行。尽管大部分RPC框架都使用TCP协议,但其实UDP也可以,而gRPC干脆就用了HTTP2。Java的Netty也属于这层的东西。
解决了上面三个问题,我们就能实现RPC了,现在我们再看看,客户端和服务端在RPC中的工作是什么:
客户端(client):
1. 将这个调用映射为Call ID。这里假设用最简单的字符串当Call ID的方法,例如这里可以:http://127.0.0.1:8080/add?a=1&b=1,即直接使用add作为path,又或者http://127.0.0.1:8080/?method=add&a=1&b=1等
2. 将Call ID,a和b序列化。可以直接将它们的值以二进制形式打包
3. 把2中得到的数据包发送给ServerAddr,这需要使用网络传输层
4. 等待服务器返回结果
4. 如果服务器调用成功,那么就将结果反序列化,并赋给total
服务端(service):
1. 在本地维护一个Call ID到函数指针的映射call_id_map,可以用dict完成
2. 等待请求,包括多线程的并发处理能力
3. 得到一个请求后,将其数据包反序列化,得到Call ID
4. 通过在call_id_map中查找,得到相应的函数指针
5. 将a和rb反序列化后,在本地调用add函数,得到结果
6. 将结果序列化后通过网络返回给Client
注意:
- Call ID可以是字符串,也可以是整数ID,映射其实是一个哈希表
- 序列化与反序列化可以自己写,当然也可以使用Protobuf或者FlatBuffers之类的。
- 网络传输库可以自己实现socket,也可以使用asio,ZeroMQ,Netty之类。
RPC使用实例
我们来简单模拟一下RPC的调用过程,实例介绍:客户端需要调用远程计算机上的计算方法,这里以加法为例(当然可以非常复杂的大型计算)
客户端的调用时无需关心远程服务端的add方法是怎么实现的,我们只需要在客户端对远程调用的add方法的过程进行封装:
service:
由于是简单的例子,就不做完整的错误处理了
package main
import (
"encoding/json"
"fmt"
"net/http"
"strconv"
)
func main() {
//http://127:0:0:1:8000/add?a=1&b=2
//Call ID 使用request.URL.PATH
http.HandleFunc("/add",
func(writer http.ResponseWriter, request *http.Request) {
//解析参数
err := request.ParseForm()
if err != nil {
panic("解码失败")
}
fmt.Println("path:", request.URL.Path)
//取出参数,做类型转换
a, err := strconv.Atoi(request.Form["a"][0])
if err != nil {
panic("转换失败")
}
b, err := strconv.Atoi(request.Form["b"][0])
if err != nil {
panic(err)
}
//返回的数据格式:json{"data":3}
//使用json编码,即序列化
writer.Header().Set("Content-Type", "application/json")
//序列化
jData, err := json.Marshal(map[string]int{
"data": a + b,
})
if err != nil {
panic(err)
}
_, err = writer.Write(jData)
if err != nil {
panic("写入失败")
}
})
//监听端口
err := http.ListenAndServe(":8080", nil)
if err != nil {
panic("监听失败")
}
}
启动服务端
client:
这里同样不做完整的错误处理了
这里我们使用第三方包:github.com/kirinlabs/HttpRequest
使用以下命令获取:
go get github.com/kirinlabs/HttpRequest
当然你也可以使用其他相关的方法来连接我们的service
package main
import (
"encoding/json"
"fmt"
"github.com/kirinlabs/HttpRequest"
)
//解析结构
type ResponseData struct {
data int `json:"data"`
}
//对add进行封装
func add(a, b int) int {
//生成一个实例
req := HttpRequest.NewRequest()
res, err := req.Get(fmt.Sprintf("http://127.0.0.1:8080/add?a=%d&b=%d", a, b))
if err != nil {
panic("连接失败")
}
body, err := res.Body()
if err != nil {
panic(err)
}
var resData ResponseData
err = json.Unmarshal(body, &resData)
if err != nil {
panic("解码失败")
}
return resData.data
}
func main() {
fmt.Println(add(1, 4))
}
打印结果:
{"data":5}
Process finished with the exit code 0
当然我们也可以直接在浏览器里访问: