Gemini入门系列(7)——GlobalEndpoint
随着Gemini-2.0-Flash的GA,一些新Feature也陆续公布。其中一个比较比较有用的就是Global Endpoint。
如大家所知,Gemini使用时需要指定Region,如果该Region资源紧张,就会出现429错误。要想使用多个Region,只能在code里轮训,使用起来比较麻烦。现在Gloabl EndPoint推出后,直接使用Global Endpoint,无需客户端的复杂配置。
目前支持Global Endpoint的模型有:
* Gemini-1.5-Flash-002
* Gemini-1.5-Pro-002
* Gemini-2.0-Flash-001
在Console使用Global Endpoint
在Console使用Global Endpoint很简单,直接在Region选择的地方选择Gloabl即可,以Gemini-1.5-Flash-002,如下选择:
如果模型选择Gemini-2.0-Flash-001,看不到该选项,但可以通过code里location的设置实现。
在Ccode里使用Global Endpoint
code的修改很简单,只需要把location设置为global即可,如下:
1 | from google import genai |
运行结果:
可以正确运行。
小结
Global Endpoint集中了全球所有Region资源,在一定程度上降低了429的出错概率,也无需客户在code里实现Region轮询,大大简化了code编写。
目前,Global Endpoint还在Public Preview阶段,所以只支持3个模型(测试版模型不支持),另外如下功能目前不支持:
* Tuning
* Batch
* Context Caching
* RAG
* DRZ/VPC-SC/ML-Processing
* Provision Thoughput
客户可以根据实际需求决定是否选择Gloabl Endpoint。