https://docs.pingcap.com/zh/tidb/stable/tidb-lightning-data-source#自定义文件匹配
该小节中,正则表达式
(?i)^(?:[^/]/)([a-z0-9_]+).([a-z0-9_]+)/(?:[^/]/)(?:[a-z0-9\-_.]+.(parquet))$
不能匹配给出的样例url
S3://some-bucket/some-subdir/some-database/some-database.some-table/part-00000-c5a881bb-58ff-4ee6-1111-b41ecff340a3-c000.gz.parquet
正确的正则表达式应为:
(?i)^(?:[^/]/)([a-z0-9\-_]+).([a-z0-9\-_]+)/(?:[^/]/)(?:[a-z0-9\-_.]+.(parquet))$
如此方可匹配到库名和表中中出现的(-)字符。
经测试,库名中和表名中可以包含(-)字符。
发贴后才发现有可能是显示问题,在注释引用下是会吞掉(\),需要转义使用(\\),这可能就是原本正确的正则表达式也变成错误的原因。