Python - Records Union
Տվյալների մանիպուլյացիան և ուսումնասիրությունը ծրագրավորման ցանկացած լեզվի հիմնական խնդիրներն են: Python-ն իր պարզությամբ և ճկունությամբ արդյունավետ սարքեր է տալիս տվյալների հետ աշխատելու և փոխակերպելու համար: Ընդհանուր գործողություններից մեկը գրառումների միավորումն է, որտեղ մենք միավորում ենք բազմաթիվ տվյալների հավաքածուներ՝ ձևավորելու միասնական համապարփակ տվյալների բազա: Այս հոդվածում մենք կուսումնասիրենք Python-ում ռեկորդային միություն ձեռք բերելու երեք մոտեցում՝ ընդգծելով դրանց հաշվարկները, շարահյուսությունը և ներառված քայլերը: Մենք պատրաստվում ենք կոդի օրինակներ տալ ելքերով՝ յուրաքանչյուր մոտեցման համապատասխանությունը ցույց տալու համար: Այսպիսով, եկեք ներս ցատկենք:
Ձայնագրությունների միություն
Python - Records Union-ը վերաբերում է բազմաթիվ տվյալների հավաքածուների կամ գրառումների համակցման գործընթացին՝ մեկ համապարփակ տվյալների ստեղծման համար: Այն ներառում է տվյալների հավաքածուների միաձուլում կամ միացում՝ հիմնված ընդհանուր ատրիբուտների կամ բանալիների վրա՝ ձևավորելու միասնական տվյալների բազա, որը ներառում է բնօրինակ տվյալների հավաքածուների բոլոր եզակի գրառումները:
Գրառումների միավորումը սովորական գործողություն է տվյալների մանիպուլյացիայի և հետաքննության մեջ, քանի որ այն թույլ է տալիս համախմբել և ինտեգրել տարբեր աղբյուրներից ստացված տեղեկությունները մեկ տվյալների բազայում՝ օգնելու հետաքննությանը կամ նախապատրաստմանը: Այն հատկապես արժեքավոր է, երբ կառավարում եք առնչվող տվյալների հավաքածուներ, որոնք ունեն ընդհանուր հատկանիշներ, կամ երբ դուք պետք է միավորեք տվյալների հավաքածուները համընկնող գրառումների հետ:
Python-ը տրամադրում է մի քանի մոտեցումներ և գործիքներ՝ ռեկորդային միավորումը արդյունավետորեն կատարելու համար: Մի քանի ընդհանուր ռազմավարություններ ներառում են ներկառուցված տվյալների կառուցվածքի օգտագործումը, պանդայի գրադարանը տվյալների մանիպուլյացիայի և միաձուլման համար, կամ այլ երրորդ կողմի գրադարանների կամ շրջանակների օգտագործումը, որոնք առաջարկում են տվյալների ինտեգրման գործառույթներ:
Մոտեցում 1. Python-ի ներկառուցված տվյալների կառուցվածքի օգտագործումը
Python-ում տվյալների հավաքածուն շահավետ գործիք է հետաքրքիր բաղադրիչների հավաքածուները հմտորեն վարելու համար: Մենք կարող ենք օգտագործել այս շեշտադրումը ձայնագրությունների միացումը հեշտությամբ կատարելու համար: Դիտարկենք տվյալների երկու հավաքածու՝ տվյալների բազա1 և տվյալների բազա2, որոնց հետ խոսվում է որպես գրառումների ցուցակներ:
Ալգորիթմ
-
Քայլ 1 - Տվյալների 1-ի և 2-ի միջև փոխարկեք հավաքածուների:
Քայլ 2 − Կատարեք միավորման գործողություն բազմությունների վրա՝ օգտագործելով union() մեթոդը:
Քայլ 3 – Փոխեք արդյունքում առաջացած հետընթացը դեպի ցուցակ:
Օրինակ
#Example
data1 = [19 , 99 ]
data2 = [4, 5, 6, 7, 8]
union_set = set(data1).union(data2)
result = list(union_set)
print(result)
Արդյունք
[ 4, 5, 6, 7, 8, 19, 99 ]
Մոտեցում 2. պանդաների գրադարանի օգտագործում
Պանդաները կարող են լինել Python-ում տեղեկատվության վերահսկման և փորձաքննության հայտնի գրադարան: Այն տալիս է բարձր արդյունավետության, հեշտ օգտագործման տվյալների կառուցվածքներ և տվյալների հետազոտման սարքեր: Մենք պատրաստվում ենք օգտագործել պանդաների տվյալների ուրվագիծը՝ արդյունավետ ձայնագրման միության գործողություններ իրականացնելու համար:
Ալգորիթմ
Քայլ 1 – Ներմուծեք պանդայի գրադարանը:
Քայլ 2 − Կազմեք տեղեկատվական ուրվագծեր df1 և df2 տվյալների բազայի 1-ից և տվյալների բազա 2-ից՝ անկախ:
Քայլ 3 − Օգտագործեք concat() աշխատանքը՝ տեղեկատվության ուրվագծերը ուղղահայաց միացնելու համար:
Քայլ 4 - Վերականգնել առաջիկա տեղեկատվության ուրվագծերի ցանկը:
Օրինակ
# import required library
import pandas as num
data1 = [['John', 25], ['Alice', 30], ['Bob', 28]]
data2 = [['Charlie', 35], ['David', 27], ['Eve', 32]]
df1 = num.DataFrame(data1)
df2 = num.DataFrame(data2)
result = num.concat([df1, df2]).reset_index(drop=True)
print(result)
Արդյունք
0 1
0 John 25
1 Alice 30
2 Bob 28
3 Charlie 35
4 David 27
5 Eve 32
Եզրակացություն
Եզրափակելով, Python-ը տարբեր մոտեցումներ է տալիս ռեկորդների միավորումը կատարելու համար՝ թույլ տալով ձեզ համատեղել տվյալների հավաքածուները և կազմել համապարփակ տվյալների բազա՝ հետազոտության կամ խնամքի համար օգնության համար: Ձայնագրությունների միությունը կարևոր դեր է խաղում տվյալների ինտեգրման և հետազոտության մեջ, ինչը թույլ է տալիս համատեղել տարբեր աղբյուրներից ստացված տեղեկատվությունը: Python-ի բազմակողմանիության և անհնազանդության և գրադարանների առկայության շնորհիվ դուք շահութաբեր կերպով կկառավարեք տարբեր չափերի և բարդությունների տվյալների հավաքածուներ:
Անկախ նրանից, թե դուք աշխատում եք փոքր տվյալների հավաքածուների հետ, թե վերահսկում եք տվյալների ինտեգրման լայնածավալ հանձնարարությունները, Python-ի հարմարվողականությունը և այս հոդվածում ստուգված մոտեցումները թույլ են տալիս հաջողությամբ համատեղել գրառումները և բացել արդյունավետ հանդիպումներ ձեր տվյալներից: Ցանկացած կասկածից վեր պետք է հաշվի առնել ձեր տվյալների հավաքածուների բնույթը, ընդհանուր բնութագրերի կամ բանալիների սերտությունը և ձեր հետազոտության հատուկ անհրաժեշտությունները Python-ում գրառումների միավորման առաջին համապատասխան մոտեցումն ընտրելիս: