Python - Records Union


Տվյալների մանիպուլյացիան և ուսումնասիրությունը ծրագրավորման ցանկացած լեզվի հիմնական խնդիրներն են: Python-ն իր պարզությամբ և ճկունությամբ արդյունավետ սարքեր է տալիս տվյալների հետ աշխատելու և փոխակերպելու համար: Ընդհանուր գործողություններից մեկը գրառումների միավորումն է, որտեղ մենք միավորում ենք բազմաթիվ տվյալների հավաքածուներ՝ ձևավորելու միասնական համապարփակ տվյալների բազա: Այս հոդվածում մենք կուսումնասիրենք Python-ում ռեկորդային միություն ձեռք բերելու երեք մոտեցում՝ ընդգծելով դրանց հաշվարկները, շարահյուսությունը և ներառված քայլերը: Մենք պատրաստվում ենք կոդի օրինակներ տալ ելքերով՝ յուրաքանչյուր մոտեցման համապատասխանությունը ցույց տալու համար: Այսպիսով, եկեք ներս ցատկենք:

Ձայնագրությունների միություն

  • Python - Records Union-ը վերաբերում է բազմաթիվ տվյալների հավաքածուների կամ գրառումների համակցման գործընթացին՝ մեկ համապարփակ տվյալների ստեղծման համար: Այն ներառում է տվյալների հավաքածուների միաձուլում կամ միացում՝ հիմնված ընդհանուր ատրիբուտների կամ բանալիների վրա՝ ձևավորելու միասնական տվյալների բազա, որը ներառում է բնօրինակ տվյալների հավաքածուների բոլոր եզակի գրառումները:

  • Գրառումների միավորումը սովորական գործողություն է տվյալների մանիպուլյացիայի և հետաքննության մեջ, քանի որ այն թույլ է տալիս համախմբել և ինտեգրել տարբեր աղբյուրներից ստացված տեղեկությունները մեկ տվյալների բազայում՝ օգնելու հետաքննությանը կամ նախապատրաստմանը: Այն հատկապես արժեքավոր է, երբ կառավարում եք առնչվող տվյալների հավաքածուներ, որոնք ունեն ընդհանուր հատկանիշներ, կամ երբ դուք պետք է միավորեք տվյալների հավաքածուները համընկնող գրառումների հետ:

  • Python-ը տրամադրում է մի քանի մոտեցումներ և գործիքներ՝ ռեկորդային միավորումը արդյունավետորեն կատարելու համար: Մի քանի ընդհանուր ռազմավարություններ ներառում են ներկառուցված տվյալների կառուցվածքի օգտագործումը, պանդայի գրադարանը տվյալների մանիպուլյացիայի և միաձուլման համար, կամ այլ երրորդ կողմի գրադարանների կամ շրջանակների օգտագործումը, որոնք առաջարկում են տվյալների ինտեգրման գործառույթներ:

Մոտեցում 1. Python-ի ներկառուցված տվյալների կառուցվածքի օգտագործումը

Python-ում տվյալների հավաքածուն շահավետ գործիք է հետաքրքիր բաղադրիչների հավաքածուները հմտորեն վարելու համար: Մենք կարող ենք օգտագործել այս շեշտադրումը ձայնագրությունների միացումը հեշտությամբ կատարելու համար: Դիտարկենք տվյալների երկու հավաքածու՝ տվյալների բազա1 և տվյալների բազա2, որոնց հետ խոսվում է որպես գրառումների ցուցակներ:

Ալգորիթմ

  • Քայլ 1 - Տվյալների 1-ի և 2-ի միջև փոխարկեք հավաքածուների:

  • Քայլ 2 − Կատարեք միավորման գործողություն բազմությունների վրա՝ օգտագործելով union() մեթոդը:

  • Քայլ 3 – Փոխեք արդյունքում առաջացած հետընթացը դեպի ցուցակ:

Օրինակ

#Example 
data1 = [19 , 99 ]
data2 = [4, 5, 6, 7, 8]

union_set = set(data1).union(data2)
result = list(union_set)

print(result)

Արդյունք

 [ 4, 5, 6, 7, 8, 19, 99 ]

Մոտեցում 2. պանդաների գրադարանի օգտագործում

Պանդաները կարող են լինել Python-ում տեղեկատվության վերահսկման և փորձաքննության հայտնի գրադարան: Այն տալիս է բարձր արդյունավետության, հեշտ օգտագործման տվյալների կառուցվածքներ և տվյալների հետազոտման սարքեր: Մենք պատրաստվում ենք օգտագործել պանդաների տվյալների ուրվագիծը՝ արդյունավետ ձայնագրման միության գործողություններ իրականացնելու համար:

Ալգորիթմ

  • Քայլ 1 – Ներմուծեք պանդայի գրադարանը:

  • Քայլ 2 − Կազմեք տեղեկատվական ուրվագծեր df1 և df2 տվյալների բազայի 1-ից և տվյալների բազա 2-ից՝ անկախ:

  • Քայլ 3 − Օգտագործեք concat() աշխատանքը՝ տեղեկատվության ուրվագծերը ուղղահայաց միացնելու համար:

  • Քայլ 4 - Վերականգնել առաջիկա տեղեկատվության ուրվագծերի ցանկը:

Օրինակ

# import required library 

import pandas as num

data1 = [['John', 25], ['Alice', 30], ['Bob', 28]]
data2 = [['Charlie', 35], ['David', 27], ['Eve', 32]]

df1 = num.DataFrame(data1)
df2 = num.DataFrame(data2)

result = num.concat([df1, df2]).reset_index(drop=True)

print(result)

Արդյունք

        0   1
 0    John  25
 1   Alice  30
 2     Bob  28
 3  Charlie  35
 4   David  27
 5     Eve  32 

Եզրակացություն

Եզրափակելով, Python-ը տարբեր մոտեցումներ է տալիս ռեկորդների միավորումը կատարելու համար՝ թույլ տալով ձեզ համատեղել տվյալների հավաքածուները և կազմել համապարփակ տվյալների բազա՝ հետազոտության կամ խնամքի համար օգնության համար: Ձայնագրությունների միությունը կարևոր դեր է խաղում տվյալների ինտեգրման և հետազոտության մեջ, ինչը թույլ է տալիս համատեղել տարբեր աղբյուրներից ստացված տեղեկատվությունը: Python-ի բազմակողմանիության և անհնազանդության և գրադարանների առկայության շնորհիվ դուք շահութաբեր կերպով կկառավարեք տարբեր չափերի և բարդությունների տվյալների հավաքածուներ:

Անկախ նրանից, թե դուք աշխատում եք փոքր տվյալների հավաքածուների հետ, թե վերահսկում եք տվյալների ինտեգրման լայնածավալ հանձնարարությունները, Python-ի հարմարվողականությունը և այս հոդվածում ստուգված մոտեցումները թույլ են տալիս հաջողությամբ համատեղել գրառումները և բացել արդյունավետ հանդիպումներ ձեր տվյալներից: Ցանկացած կասկածից վեր պետք է հաշվի առնել ձեր տվյալների հավաքածուների բնույթը, ընդհանուր բնութագրերի կամ բանալիների սերտությունը և ձեր հետազոտության հատուկ անհրաժեշտությունները Python-ում գրառումների միավորման առաջին համապատասխան մոտեցումն ընտրելիս: