Oracle TAC实战

简介

Oracle TAC (Transparent Application Continuity, 透明应用连续性),是Oracle 高可用架构下,用来确保应用持续可用的一项重要特性。无论是计划内的数据库日常维护,还是遭遇突然宕机崩溃等极端事件,TAC都能确保应用程序能迅速切换到可用的数据库实例并持续正常运行,并且用户已经提交但未完成的交易也不会中断,TAC能够在可用的实例上重放并继续未完成的事务,保证了用户体验。

因此,用好TAC特性,能够为数据库的日常维护提供方便,有效消除应用服务的停机时间顾虑;能够有效应对数据库实例的机器、网卡、系统等突发异常事件;甚至能够让应用端透明地实现数据中心灾备冗余架构下的主备中心切换。

本文中用到的Oracle数据库版本是19c以及Oracle JDBC版本是19.20.0.0。

创建数据库服务

首先需要在数据库端创建一个开启了 TAC 的服务,后续在应用中设置JDBC URL 时需要指定服务名 (注意将 failover_restore 和 failovertype设置为 AUTO,其它参数可以查看一下帮助 -help):

$ srvctl add service -db mydb -pdb PDB1 -service mytacsvc -preferred serv1 -available serv2 -failover_restore AUTO -failoverretry 30 -failoverdelay 10 -commit_outcome TRUE -failovertype AUTO -replay_init_time 1800 -retention 86400 -notification TRUE -drain_timeout 300 -stopoption IMMEDIATE

可变函数处理

有些数据库函数在每次调用的时候都会返回新的值,这些函数称为可变函数,包括sysdate, systimestamp, local_timestamp, current_timestamp, sys_guid, sequence.nextval。

如果一个未完成的事务是由PL/SQL语句块组成,并且语句块中用到了可变函数,那么当TAC在可用实例上尝试重放这个事务时,可变函数的返回值是变化了的,那么这个重放就会被拒绝。为了在重放时能够使用原来的返回值,需要在数据库端对可变函数或对象赋KEEP权限:

GRANT KEEP DATE TIME TO [db_user];
GRANT KEEP SYSGUID TO [db_user];
ALTER SEQUENCE [sequence_name] KEEP;
-- 如果sequence还被其他数据库用户使用,需要给这些用户赋与KEEP权限
GRANT KEEP SEQUENCE ON [db_user.sequence_name] TO [other_user];


端口及防火墙考虑

Oracle Net Listener 的默认监听地址是1521/tcp,这是客户端创建数据库连接需要用到的端口。

Oracle Notification Services (ONS) 的默认监听地址是6200/tcp,将数据库集群的一些情况(如节点维护、故障、负载等),通过FAN (Fast Application Notification) 事件及时反馈给应用。

以上两个端口,必须保证应用服务器到数据库服务器之间是通的,可以在应用服务器上用 telnet 测试连通性。

另外,如果应用服务器到数据库服务器中间有防火墙,需要检查防火墙对空闲长连接的timeout设置。在应用程序的连接池设置中,如果设置了idle timeout, keep-alive interval 以及检查间隔等参数,需要将这些值都设置成小于防火墙上设置的 timeout,以确保防火墙在断开连接之前它们能够完成检查。

不支持的 Oracle JDBC 具体扩展类型

一般来说,应用程序中不会直接使用Oracle JDBC驱动提供的一些具体的扩展类型。但如果由于特殊原因,应用中用到了oracle.sql包下的OPAQUE,ANYDATA,STRUCT这几个类,TAC是不支持重放这类语句的。

对于 oracle.sql.OPAQUE,可以用新的替代类 oracle.jdbc.OracleOpaque.

对于 oracle.sql.STRUCT,可以用JDBC标准的类取代: java.sql.Struct.

对于 oracle.sql.ANYDATA,最好能从设计上转化为具体的类型进行操作;或者是接受数据库节点切换后,这类未完成的事务不需要自动重放 (譬如这笔交易可以失败后由用户重新提交)。

另外,还可以下载 orachk工具扫描应用中是否用到了上述不支持的类 (orachk -acchk -h 查看用法)

应用端连接池

Java 应用中使用TAC,首选 Oracle UCP。UCP无缝集成Oracle数据库集群,应用端使用 UCP能获得其它连接池无法实现的一些好处,如支持TAC,支持连接池快速排干以及连接快速恢复 (FCF, Fast Connection Failover),动态连接负载均衡 (RCLB, Runtime Connection Load Balancing)等。

应用端引进UCP依赖比较简单,如果用maven的话,pom文件中增加ojdbc8依赖即可,如:


    com.oracle.database.jdbc
    ojdbc8-production
    19.20.0.0
    pom


应用端连接池的基本配置 (Spring Boot应用为例)

Spring Boot v2.4.0及以上版本的配置属性已经原生支持了Oracle UCP,因此,跟配置其它连接池一样,只需要在Spring Boot配置文件中指定即可,无需任何代码端变动:

spring.datasource.url=jdbc:oracle:thin:@(DESCRIPTION=(FAILOVER=on)(LOAD_BALANCE=off) (TRANSPORT_CONNECT_TIMEOUT=5)(RETRY_COUNT=20)(RETRY_DELAY=3)(ADDRESS_LIST=(LOAD_BALANCE=on)(ADDRESS=(PROTOCOL=TCP)(HOST=tacdb-scan.regionalpublics.hysunhevcn.oraclevcn.com)(PORT=1521))) (CONNECT_DATA=(SERVICE_NAME='mytacsvc.regionalpublics.hysunhevcn.oraclevcn.com')))
spring.datasource.username=ncmsob
spring.datasource.password=xxxxxx
spring.datasource.type=oracle.ucp.jdbc.PoolDataSource
spring.datasource.oracleucp.connection-pool-name=pool-ncmsobs
spring.datasource.oracleucp.connection-factory-class-name=oracle.jdbc.replay.OracleDataSourceImpl
spring.datasource.oracleucp.fast-connection-failover-enabled=true
spring.datasource.oracleucp.initial-pool-size=30
spring.datasource.oracleucp.min-pool-size=30
spring.datasource.oracleucp.max-pool-size=200
……


如果是用Spring Boot v2.4.0以下的老版本(如 2.1.x),配置也很简单,只需新增一个 Configuration Bean,指向配置文件中的UCP配置段即可,如:

@Configuration
public class UCPDataSource {
    @Bean("ncmsobs")
    @Primary
    @ConfigurationProperties("spring.datasource.oracleucp") // 指向配置文件中的 UCP 配置段
    public DataSource ds_ncmsobs() {
        return PoolDataSourceFactory.getPoolDataSource();
    }
}


# 以下是配置文件中的 UCP 配置段:
spring.datasource.oracleucp.connection-pool-name=pool-ncmsobs
spring.datasource.oracleucp.u-r-l=jdbc:oracle:thin:@(DESCRIPTION=(FAILOVER=on)(LOAD_BALANCE=off) (TRANSPORT_CONNECT_TIMEOUT=5)(RETRY_COUNT=20)(RETRY_DELAY=3)(ADDRESS_LIST=(LOAD_BALANCE=on)(ADDRESS=(PROTOCOL=TCP)(HOST=tacdb-scan.regionalpublics.hysunhevcn.oraclevcn.com)(PORT=1521))) (CONNECT_DATA=(SERVICE_NAME='mytacsvc.regionalpublics.hysunhevcn.oraclevcn.com')))
spring.datasource.oracleucp.user=ncmsob
spring.datasource.oracleucp.password=xxxxxx
spring.datasource.oracleucp.connection-factory-class-name=oracle.jdbc.replay.OracleDataSourceImpl
spring.datasource.oracleucp.fast-connection-failover-enabled=true
spring.datasource.oracleucp.initial-pool-size=30
spring.datasource.oracleucp.min-pool-size=30
spring.datasource.oracleucp.max-pool-size=200
……

注意JDBC URL用如上的 TNS格式,驱动指定为可重放(replay)的驱动类:oracle.jdbc.replay.OracleDataSourceImpl

JDBC语句缓存(Statement Cache)

语句缓存对性能提升帮助较大,能避免频繁的资源申请以及重复的SQL语句解析。然而,直接在代码中创建一个集合如Map来存放语句对象或者直接打开应用服务器(如WebLogic, Tomcat等)自身的语句缓存功能是不支持的。TAC支持的是JDBC连接自身的语句缓存,每个JDBC连接的语句缓存都是独立的。

如果用UCP连接池,可以简单的通过max-statements属性开启JDBC语句缓存,如:

spring.datasource.oracleucp.max-statements=200

也可以通过直接设置连接属性oracle.jdbc.implicitStatementCacheSize开启,如:

spring.datasource.oracleucp.connection-properties.oracle.jdbc.implicitStatementCacheSize=200


超时与保活机制

超时包括连接建立超时以及连接创建之后的读Socket超时。在上述 UCP配置的 JDBC URL中,指定了连接建立超时的参数: (TRANSPORT_CONNECT_TIMEOUT=5)(RETRY_COUNT=20)(RETRY_DELAY=3) ,表示连接数据库1521端口的超时时间设为5秒,如果不成功再重试20次(总共执行21次),每次连接失败后间隔3秒再重试;如果重试次数超过设置的值依然不成功,则连接建立失败。

读Socket超时: 如果程序从连接池中取到一个数据库连接对象之后,遭遇数据库实例对外服务的网卡突然坏掉等极端事件,并没有向应用端发出任何的中断信号,那么应用端是不知道这个连接已经失效了的。此时不管应用程序通过连接对象向数据库请求任何数据,都是无法得到回应的,那么应用线程就只能阻塞在读Socket上并长时间地等待。因此,有必要合理设置一下Socket read timeout 的值,让线程能够及时退出。我们可以通过设置连接参数来指定读Socket的最大等待时间,比如将Read timeout设置成30秒,Spring Boot 的配置文件中可这样指定:

spring.datasource.oracleucp.connection-properties.oracle.jdbc.ReadTimeout=30sec

保活机制(keep-alive): 当TCP连接的一端突然崩溃造成另一端无法正常关闭连接时,可以通过keep-alive检测机制判断并关闭连接。我们可以通过在客户端和服务端操作系统层面设置keep-alive相关参数 (tcp_keepalive_time, tcp_keepalive_probs, tcp_keepalive_intvl),但是这个影响是全局的,所以有时我们可能并不希望这样做。

Oracle数据库端,可以通过sqlnet.ora文件中设置 SQLNET.EXPIRE_TIME来指定服务端的保活时间,如 SQLNET.EXPIRE_TIME=10 表示保活空闲时间设置为10分钟(包括重试在内,大概11分钟左右,无效的连接就会检测到并关闭)。

在应用程序端,可以通过连接属性来指定连接的保活参数。以下连接属性代表连接的保活空闲时间为60秒,重试3次,每次间隔5秒,总共75秒左右,无效的连接就会检测到并关闭:oracle.net.keepAlive=true, oracle.net.TCP_KEEPIDLE=60, oracle.net.TCP_KEEPINTERVAL=5, oracle.net.TCP_KEEPCOUNT=3

Spring Boot的配置文件中对应的连接属性配置如下:

spring.datasource.oracleucp.connection-properties.oracle.net.keepAlive=true
spring.datasource.oracleucp.connection-properties.oracle.net.TCP_KEEPIDLE=60
spring.datasource.oracleucp.connection-properties.oracle.net.TCP_KEEPINTERVAL=5
spring.datasource.oracleucp.connection-properties.oracle.net.TCP_KEEPCOUNT=3


ADG 数据灾备架构

在 ADG (Active Data Guard) 数据灾备架构下,需在主备集群中创建一个相同名字的服务,如:

$ srvctl add service -db mydb -pdb PDB1 -service mytacsvc -preferred serv1 -available serv2 -failover_restore AUTO -failoverretry 30 -failoverdelay 10 -commit_outcome TRUE -failovertype AUTO -replay_init_time 1800 -retention 86400 -notification TRUE -drain_timeout 300 -stopoption IMMEDIATE -role PRIMARY

这里建议显示指定 -role 参数,-role PRIMARY 代表集群切换时,服务只在主集群上自动启动。

应用程序中,在配置UCP连接池时,通过 ADDRESS_LIST将主备集群的地址都指定在JDBC URL中:

spring.datasource.oracleucp.connection-pool-name=pool-ncmsobs
spring.datasource.oracleucp.u-r-l= jdbc:oracle:thin:@(DESCRIPTION=(FAILOVER=on)(LOAD_BALANCE=off) (TRANSPORT_CONNECT_TIMEOUT=5)(RETRY_COUNT=20)(RETRY_DELAY=3) (ADDRESS_LIST=(LOAD_BALANCE=on)(ADDRESS=(PROTOCOL=TCP)(HOST=tacdb-scan.regionalpublics.hysunhevcn.oraclevcn.com)(PORT=1521))) (ADDRESS_LIST=(LOAD_BALANCE=on)(ADDRESS=(PROTOCOL=TCP)(HOST=tacdbdg-scan.regionalpublics.hysunhevcn.oraclevcn.com)(PORT=1521)))(CONNECT_DATA=(SERVICE_NAME='tac.regionalpublics.hysunhevcn.oraclevcn.com')))
spring.datasource.oracleucp.user=ncmsob
spring.datasource.oracleucp.password=xxxxxx
spring.datasource.oracleucp.connection-factory-class-name=oracle.jdbc.replay.OracleDataSourceImpl
spring.datasource.oracleucp.fast-connection-failover-enabled=true
spring.datasource.oracleucp.initial-pool-size=30
spring.datasource.oracleucp.min-pool-size=30
spring.datasource.oracleucp.max-pool-size=200
……

另外值得注意的是,JDBC URL中指定的(RETRY_COUNT + 1) * RETRY_DELAY 的值建议设置成大于ADG切换所需要的时间,这样应用线程能等待ADG切换完成从而取到有效的连接,也能在避免ADG切换过程中,应用因无法连接到数据库而打印大批量的连接错误信息到日志文件中。

展开阅读全文

页面更新:2024-04-03

标签:集群   缓存   语句   应用程序   函数   实战   实例   属性   参数   数据库   时间

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top