今天跟大家分享下我們?nèi)绾卧贓xcel中實(shí)現(xiàn)相似度匹配,這也是一個(gè)學(xué)員提取的問(wèn)題,最簡(jiǎn)單的方法就是利用PQ之前發(fā)過(guò),但是無(wú)奈WPS用不了,今天新的解決方法來(lái)了
![]()
一、拆分?jǐn)?shù)據(jù)
公式:=REGEXEXTRACT(A2,"["&D2&"]",1)
在這列D2是查找值,我們查找值的前后連接方括號(hào)作為正則的匹配規(guī)則,它就表示會(huì)在數(shù)據(jù)源中匹配【ABC2】這四個(gè)字符,如果可以匹配到就會(huì)返回對(duì)應(yīng)的字母,具體效果如下圖所示
![]()
得到了字母就可以使用COUNTA函數(shù)對(duì)這個(gè)區(qū)域進(jìn)行計(jì)數(shù),來(lái)得到數(shù)據(jù)提取的個(gè)數(shù)
公式:=COUNTA(REGEXEXTRACT(A2,"["&D2&"]",1))
二、公式擴(kuò)展
上面演示的僅僅是一個(gè)結(jié)果,我是要對(duì)整列的數(shù)據(jù)進(jìn)行比較,所以就需要對(duì)這個(gè)公式進(jìn)行擴(kuò)展,讓他對(duì)一整列的數(shù)據(jù)進(jìn)行計(jì)數(shù),就可以考慮使用BYROW,它的作用是將函數(shù)應(yīng)用于整行中,結(jié)果如下圖所示
公式:=BYROW(A2:A11,LAMBDA(X,COUNTA(REGEXEXTRACT(X,"["&F2&"]",1))))
這個(gè)公司的關(guān)鍵點(diǎn)就是將A2:A11這區(qū)域代入到正則函數(shù)中,對(duì)整行數(shù)據(jù)進(jìn)行拆分計(jì)數(shù),在當(dāng)前的表格中最大的數(shù)據(jù),就是我們需要的最相似的數(shù)據(jù)
![]()
三、提取數(shù)據(jù)
公式:=FILTER(B2:B11,MAX(BYROW(A2:A11,LAMBDA(X,COUNTA(REGEXEXTRACT(X,"["&E2&"]",1)))))=BYROW(A2:A11,LAMBDA(X,COUNTA(REGEXEXTRACT(X,"["&E2&"]",1)))))
公式雖然比較長(zhǎng),但是并不難理解,主體是一個(gè)FILTER函數(shù)來(lái)做數(shù)據(jù)篩選,我們使用MAX函數(shù)提取計(jì)數(shù)結(jié)果來(lái)得到最大值,最大值對(duì)應(yīng)的就是最相似的數(shù)據(jù)
![]()
四、直接套用
這個(gè)函數(shù)想要看懂還是需要有一定的基礎(chǔ)的,如果你看不懂也沒(méi)關(guān)系,粘貼下方公式直接使用,只需要修改2處即可
公式=LET(y,A2:A11,x,B2:B11,FILTER(x,MAX(BYROW(y,LAMBDA(X,COUNTA(REGEXEXTRACT(X,"["&E2&"]",1)))))=BYROW(y,LAMBDA(X,COUNTA(REGEXEXTRACT(X,"["&E2&"]",1))))))
1. A2:A11修改為你表格的查找列
2. B2:B11修改為你的表格的結(jié)果列
![]()
五、注意事項(xiàng)
使用這個(gè)函數(shù),大家需要注意2點(diǎn),不然有可能會(huì)造成無(wú)法使用的情況
1. 如果你是WPS,請(qǐng)將REGEXEXTRACT替換為REGEXP,它們的名字不一樣,用法是一樣的
2. 查找值不要添加任何的標(biāo)點(diǎn)符號(hào),如果你的標(biāo)點(diǎn)符號(hào)恰好是正則中的元字符,這個(gè)函數(shù)就無(wú)法使用了
想要提高工作效率,不想再求同事幫你解決各種Excel問(wèn)題,可以了解下我的專欄,WPS用戶也能使用,講解了函數(shù)、圖表、透視表、數(shù)據(jù)看板、AI做表格等功能
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.